陈雁翔
陈雁翔,女,工学博士,教授,博士生导师。 2004年6月毕业于中国科学技术大学电子科学与技术系,获工学博士学位。
2006年8月至2008年4月在美国伊利诺大学香槟分校(UIUC)电子计算机工程(ECE)系做访问学者,合作导师:Thomas Huang, Mark Johnson。
2012年10月至2013年1月在新加坡国立大学(NUS)电子计算机工程(ECE)系做访问学者,合作导师:颜水成。
目录
科研项目
国家自然科学基金面上项目:视听觉多对齐机制下跨模态生成方法研究(61972127)
国家自然科学基金面上项目:基于音视频关联的交叉感知驱动选择性注意机制研究(61672201)
国家自然科学青年基金:具有情感的可视语音中基于耦合关系的音视频关联方法的研究(61105076)
安徽省科技攻关重大专项:“畅行”交通云服务关键技术与系统研发(15czz02074)
安徽省自然科学基金:基于视频检测跟踪的异常车辆警务联动控制方法的研究(1408085MKL76)
安徽省自然科学基金:可视语音中基于发音特征的音视频关联模型的研究(11040606M127)
安徽省科技攻关语音产业创新专项:具备友好互动能力的情感感知和情感自然表达关键技术与系统(11010202192)
第51批中国博士后科学基金面上资助:智能人机语音交互中基于文本与语音的情感融合研究(2012M511402)
企业委托项目:智能交通驾驶员安全带检测系统、智能交通驾驶员行为分析预警系统等。
省级教研项目:面向数字媒体方向的创新培养体系的研究(2016jyxm0815)
发明专利
Method, System and Electronic Device for Processing Audio-Visual Data(美国专利),US17038311
音视频数据处理方法、系统、电子设备及存储介质,ZL202010257755.5
基于韵律特征参数和情感参数关联性的语音情感修正方法,ZL201310100284.7;
一种基于属性空间的人脸可视化特征表征方法,ZL201310192441.1;
一种驾驶员多种行为预警系统及危险评估方法,ZL201510054227.9;
一种基于Adaboost的安全带检测方法,ZL201410174018.3;
一种基于声谱图显著性检测的音频识别方法,ZL201510054228.3。
曾作为负责人参加2008年由欧洲的CHIL(Computers in the Human Interaction Loop)和美国的NIST(National Institute of Standards and Technology)联合举办的CLEAR(Classification of Events, Activities and Relationships)评测,2004年由美国NIST举办的世界性的说话人识别评测,分别取得第一名和第三名。
研究方向
多媒体信息处理、多媒体安全及伪造检测、计算机视觉、图像处理、人工智能
与中科院重庆绿色智能技术研究院、新加坡国立大学建立了良好的合作关系,可以派遣学生前往进修。
2014年度和2015年度,指导学生获大学生创新创业项目(结题优秀),已指导多名硕士生在高水平国际期刊上发表论文,获国家奖学金(奖金2万)。凡参与项目的学生均提供助研津贴。
研究室位于翡翠科教楼西楼A601,工作日均在研究室。希望大家积极报考,体现自己在研究生阶段的人生价值。
获奖情况
2021年中国大学生服务外包创新创业大赛国家级三等奖 指导教师
2019年中国大学生计算机设计大赛国家级二等奖 指导教师
2010年全国信息安全大赛国家级三等奖 指导教师
2003年校青年教师讲课比赛 校二等奖 计算机与信息学院一等奖
2013年安徽省科学技术进步三等奖
学术成果
1. Yanxiang Chen, Pengcheng Zhao, Meibin Qi, Yang Zhao, Wei Jia, and Ronggang Wang ,“Audio Matters in Video Super-Resolution by the Implicit Semantic Guidance”, IEEE Trans. On Multimedia (TMM), Accepted, 2022
2. Yanxiang Chen, Yupeng Zhu, Pengcheng Zhao, Jinlin Guo,“Can you trust what you hear: Effects of audio-attacks on voice-to-face generation system”, International Journal of Intelligent Systems(JCR 1区),https://doi.org/10.1002/int.22825,2022
3. HuaDong Tan, Guang Wu, Yanxiang Chen*, “Spectrogram Analysis Via Self-Attention for Realizing Cross-Model Visual-Audio Generation”, ICASSP(CCF B类会议), 2020
4.Yanxiang Chen, Daru Pan, et al. Indoor Scene Understanding via monocular RGB-D images, Information Sciences,320(1), pp 361-371, 2015
5.Yanxiang Chen, Tam V. Nguyen, Mohan Kankanhalli, Shuicheng Yan, Meng Wang, “Audio Matters in Visual Attention”, IEEE Trans. On Circuits and Systems for Video Technology (TCSVT), 24(11), pp 1992-2003, 2014
6. Yingjie Xia, Zhenguang Liu, Liqiang Nie, Yanxiang Chen*, et al. Media Quality Assessment by Perceptual Gaze-Shift Patterns Discovery, IEEE Trans. On Multimedia (TMM), 19(8), pp 1811-1820, 2017
7. Yanxiang Chen, Guang Wu, Jie Zhou, Guojun Qi, “Image generation via latent space learning using improved combination”, Neurocomputing, 340, pp 8-18, 2019
8.Yanxiang Chen, Gang Tao, et al. Accurate Seat belt detection in Road Surveillance Images Based on CNN and SVM, Neurocomputing, 274, pp 80-87, 2018 9.Yanxiang Chen, Yifei Pan, Minglong Song, Meng Wang, “Improved seam carving combining with 3D saliency for image retargeting”, Neurocomputing, 151, pp 645-653, 2015 10. Yanxiang Chen, Minglong Song, LixiaXue, Xiaoxue Cheng, Meng Wang, “An audio–visual human attention analysis approach to abrupt change detection in videos”, Signal Processing,110, pp 143-154, 2015 11. Yanxiang Chen, et al. Pedestrian detection by learning a mixture mask model and its implementation, Information Sciences,372, pp148-161, 2016
12. Yifei Pan, Runtian Long, Xiaoxue Cheng, Yanxiang Chen*, “Saliency-based Auditory Detection Method Using Energy Linear Superposition”, Pacific-Rim Conference on Multimedia (PCM), 2013
13. Yanxiang Chen, Jian Xie, “Emotional Speech Recognition Based on SVM with GMM Supervector”, Journal of Electronics (China), Vol. 29, No. 3, pp. 339-344, 2012 14. Yiming Tang, Yanxiang Chen, “Basic universal triple I restriction methods for FMP problem”, Applied Mathematics & Information Sciences, Vol. 6, No.3S, pp. 959-966, 2012 15. Yiming Tang, Yanxiang Chen, “Differently implicational α-universal triple I restriction method of (1, 2, 2) type”, Journal of Systems Engineering and Electronics, Vol.23, No. 4, pp. 560-573, 2012 16. Yiming Tang, Yanxiang Chen, “Universal triple I method and its application to textual emotion polarity recognition”, International Conference on Quantitative Logic and Soft Computing, pp. 189-196, 2012 17. Yanxiang Chen, Xi Wu, “A Research on Emotional Feature Extraction and Analysis in Speech”, In Proceedings of the IEEE International Conference on Multimedia Technology (ICMT 2011), Hangzhou, China, pp. 3374-3376, 2011 18. Yanxiang Chen, Ming Liu, “Audio-Visual Speaker Identification with Asynchronous Articulatory Feature”, Electronics Letters, Vol. 46, No. 3, pp. 255-256, 2010 19. Yanxiang Chen, “Research on Audio-Visual Asynchronous Correlation for Speaker Identification Based on DBN”, Future Intelligent Information Systems (Lecture Notes in Electrical Engineering), LNEE 86, 2010, pp. 15-21, Springer
20. Yanxiang Chen, “An Unsupervised Scheme for Speaker Indexing of Audio Databases”, In Proceedings of the IEEE International Conference on Intelligent Computing and Intelligent Systems (ICIS 2009), Shanghai, China, pp. 90-93, 2009 21. Yanxiang Chen, “A Chain of Gaussian Mixture Model for Text-independent Speaker Recognition”, In Proceedings of the IEEE International Conference on Speech Database and Assessments (Oriental COCOSDA 2009) , Beijing, China, pp. 92-95, 2009 22. Ming Liu, Yanxiang Chen, “Multichannel and Multimodality Person Identification” , Multimodal Technologies for Perception of Humans (Lecture Notes in Computer Science), LNCS 4625, 2008, pp. 248-255, Springer 23.Yanxiang Chen, Qiong Wang, “A Speaker Based Unsupervised Speech Segmentation Algorithm Used in Conversational Speech”, Knowledge Science, Engineering and Management (Lecture Notes in Artificial Intelligence), LNAI 4798, 2007, pp. 396-402, Springer 24. 陈雁翔,刘鸣,“基于发音特征的音视频说话人识别鲁棒性的研究”,《电子学报》,Vol. 38, No. 12, pp.2920-2924, 2010
25. 陈雁翔,龙润田,“基于PAD情感模型的可训练语音合成研究”,《模式识别与人工智能》,Vol. 26, No. 11, pp.1209-1215, 2013
26. 陈雁翔,吴玺,“音频盲取证中一种基于EM的重采样检测方法”,《电路与系统学报》,Vol. 17, No. 4, pp.118-123, 2012
27. 陈雁翔,“梯度方向直方图在语谱图映射中的应用”,《计算机工程与应用》,Vol. 47, No. 18, pp.146-149, 2011
28. 陈雁翔,刘鸣,“智能环境中音视频双模态的身份辨识”,《中国科学技术大学学报》,Vol. 40, No. 5, pp. 486-490, 2010
29. 陈雁翔,戴蓓蒨,周曦,刘鸣,“一种适于非限定人语音识别的并行隐马尔可夫模型(PHMM)”,《电子与信息学报》, Vol. 26, No. 10, pp. 1601-1606, 2004
30. 陈雁翔,戴蓓蒨,周曦,李辉,“基于关键数字和HMM的数字串说话人身份确认系统”,《中国科学技术大学学报》, Vol.34, No.1, pp. 70-75, 2004
31. 陈雁翔,戴蓓蒨,周曦,李辉,“基于对话语音的与文本无关的说话人确认系统的研究”, 《中文信息学报》, Vol.18, No.2, pp. 36-42, 2004 [1]