当前栏目:

《媒体语料库及其应用》实验教学大纲

时间:2018-06-30浏览:45设置

课程中英文名称      《媒体语料库及其应用》       

    The Media Corpus and Its Applications           

课程代码                18020206004    

培养层次                  大学本科    

适用专业                播音与主持艺术   

课程属性                 专业选修课    

开设学期                    3          

学分数                   2         

一、实验目的与要求

(一)实验性质

此实验课程为媒体语料库及其应用的辅助实操环节,贯穿理论与实践,具有综合性和实践性特点。依托媒体学与语言科学理论,学生将在现实问题中进行实践操作,并探索解决问题的方法。

 

(二)实验目的

培养学生运用专业理论知识,分析,处理,挖掘大规模媒体文本数据的能力。通过实际操作,深化学生对媒体语料库的理解,提升其技术应用能力。

帮助学生加深对媒体语言现象的理解和分析能力,培养学生运用语料库进行自主研究的技能,并提高他们的信息技术素养和大数据思维。

 

(三)基本要求

1. 理解和掌握媒体语料库的构建方法和步骤。

2. 能够运用语料库工具进行媒体语言内容的提取、清洗和分析。

3. 能够针对特定问题,设计并实施语料库研究方案。

4. 提高学生的数据科学素养,培养他们的批判性思维和创新思维。

 

二、实验项目与提要

序号

实验项目

关键步骤

内容提要

学时

实验

类型

1

媒体语料库的构建

确定研究目标和问题、设定语料库规模和范围、收集语料数据、预处理数据、构建语料库结构、数据标注和注释、开发查询工具、实证分析和结果展示、评估和反思。

如何使用自动化工具收集媒体文本,和清洗、存储与管理这些数据。

1

综合型

2

语料库检索及数据可视化

设定实验目标,收集和预处理语料数据。利用查询和分析工具进行查询、过滤和分析。使用可视化工具展示结果,总结实验结论。

如何查询语料库,以及如何使用现代的数据可视化工具呈现查询结果

1

技术型

3

媒体语料库分析

设定实验目标、提取文本特征,如词频、情感极性等。应用统计和机器学习技术分析规律。解释结果,得出结论。

学习使用统计及自然语言处理(NLP)方法进行分析,探索媒体文本中的规律与趋势。

1

创新型

4

语音语料的编辑、标注与分析

确定研究目标和问题、标注语料,包括语音的文本转写和语音特征的注释。分析语料,提取语音特征、建立模型和数据统计。对结果进行评估和解释,得出实验结论。

学生将学习如何利用软件AudacityPraat编辑、标注与分析

1

综合型

三、作业要求及成绩考核办法

学生需要提交每次实验的设计、结果分析以及结论,以此来展示他们对语料库建设、分析、管理和应用的理解。

每次实验报告占总分的15%,共计60%,剩下的40%将根据他们在课堂讨论,问题解答以及项目合作中的表现评定。

 

四、教材及主要参考书

(一)教材

刘华. 语料库语言学:理论、工具与案例,北京:外语教学与研究出版社,2020.12

(二)主要参考书

[1] 王建新. 《计算机语料库的建设与应用》,清华大学出版社,2015.

[2] 宋继华, 杨尔弘,王强军.《中文信息处理教程》,高等教育出版社,2011.

[3] 黄昌宁,李涓子. 《语料库语言学》,商务印书馆,2002.

 

撰写人: 马创新         审核人:


同栏目信息

其它相关信息