课程中英文名称 《媒体语料库及其应用》
The Media Corpus and Its Applications
课程代码 18020206004
培养层次 大学本科
适用专业 播音与主持艺术
课程属性 专业选修课
开设学期 3
学分数 2
(一)实验性质
此实验课程为媒体语料库及其应用的辅助实操环节,贯穿理论与实践,具有综合性和实践性特点。依托媒体学与语言科学理论,学生将在现实问题中进行实践操作,并探索解决问题的方法。
(二)实验目的
培养学生运用专业理论知识,分析,处理,挖掘大规模媒体文本数据的能力。通过实际操作,深化学生对媒体语料库的理解,提升其技术应用能力。
帮助学生加深对媒体语言现象的理解和分析能力,培养学生运用语料库进行自主研究的技能,并提高他们的信息技术素养和大数据思维。
(三)基本要求
1. 理解和掌握媒体语料库的构建方法和步骤。
2. 能够运用语料库工具进行媒体语言内容的提取、清洗和分析。
3. 能够针对特定问题,设计并实施语料库研究方案。
4. 提高学生的数据科学素养,培养他们的批判性思维和创新思维。
序号 | 实验项目 | 关键步骤 | 内容提要 | 学时 | 实验 类型 |
1 | 媒体语料库的构建 | 确定研究目标和问题、设定语料库规模和范围、收集语料数据、预处理数据、构建语料库结构、数据标注和注释、开发查询工具、实证分析和结果展示、评估和反思。 | 如何使用自动化工具收集媒体文本,和清洗、存储与管理这些数据。 | 1 | 综合型 |
2 | 语料库检索及数据可视化 | 设定实验目标,收集和预处理语料数据。利用查询和分析工具进行查询、过滤和分析。使用可视化工具展示结果,总结实验结论。 | 如何查询语料库,以及如何使用现代的数据可视化工具呈现查询结果 | 1 | 技术型 |
3 | 媒体语料库分析 | 设定实验目标、提取文本特征,如词频、情感极性等。应用统计和机器学习技术分析规律。解释结果,得出结论。 | 学习使用统计及自然语言处理(NLP)方法进行分析,探索媒体文本中的规律与趋势。 | 1 | 创新型 |
4 | 语音语料的编辑、标注与分析 | 确定研究目标和问题、标注语料,包括语音的文本转写和语音特征的注释。分析语料,提取语音特征、建立模型和数据统计。对结果进行评估和解释,得出实验结论。 | 学生将学习如何利用软件Audacity、Praat编辑、标注与分析 | 1 | 综合型 |
学生需要提交每次实验的设计、结果分析以及结论,以此来展示他们对语料库建设、分析、管理和应用的理解。
每次实验报告占总分的15%,共计60%,剩下的40%将根据他们在课堂讨论,问题解答以及项目合作中的表现评定。
刘华. 语料库语言学:理论、工具与案例,北京:外语教学与研究出版社,2020.12
[1] 王建新. 《计算机语料库的建设与应用》,清华大学出版社,2015年.
[2] 宋继华, 杨尔弘,王强军.《中文信息处理教程》,高等教育出版社,2011年.
[3] 黄昌宁,李涓子. 《语料库语言学》,商务印书馆,2002年.
撰写人: 马创新 审核人: