课程中英文名称 基于R语言的数据统计应用
Application of Data Statistics
Based on R Language
课程代码 18020206001
培养层次 大学本科
适用专业 汉语国际教育
课程属性 专业选修课
开设学期 2
学分数 1
(一)实验性质
本实验课程面向播音与主持艺术专业本科生,为适应专业学生统计学习与应用的需要开设,以技术型实验为主。实验的主要内容为R语言编程基础、R语言统计和绘图。
(二)实验目的
实验目的为初步了解R语言和R语言编程基础,包括初步R语言与数学计算入门、介绍R和R Studio、R语言的几种基本变量类型、编写控制流程(if/else循环)、数据的基本操作(导入/导出、清洗)、R语言基本作图(ggplot2)、利用R语言进行描述统计和推论统计,能够利用R语言完成数据实际数据分析并形成研究报告。
(三)基本要求
要求学生能够掌握R语言的基本语法和数据分析的基本操作规范,熟悉各种常用统计方法的操作流程,能够根据研究需要选择恰当的统计方案,并能够正确解读统计结果,形成满足规范的统计结果和报告。
序号 | 实验项目 | 关键步骤 | 内容提要 | 学时 | 实验 类型 |
1 | R语言入门 | 下载和安装R与R Studio;了解R Studio的基本界面;使用R语言的帮助文档 | 1.安装R;2.安装R Studio; 3.R Studio界面;4.R包的安装和载入; 5.R的帮助系统 | 1 | 实验 |
2 | R语言基本语法 | R语言的基本变量类型:向量(vector)、矩阵(matrix)、数组(array)、数据框(data frame)、因子(factor)、列表(lists):等;导入/导出excel/txt数据 | 1.在R中进行数学运算;2. R语言的基本变量类型;3. 数据的导入/导出;4.数据清洗;5.Tidyverse工作流 | 1 | 实验 |
3 | R语言绘图基础 | ggplot2绘图基本思想:图层结构 | 1.ggplot2介绍;2.深入了解ggplot2;3. ggplot2基本作图类别 | 3 | 实验 |
4 | R语言描述统计 | 均值、中位数、方差、标准差、皮尔逊/肯塔尔相关系数的计算 | 1.集中趋势分析;2.离散趋势分析;3.相关分析 | 3 | 实验 |
5 | R语言推论统计 | 假设检验的基本思想与逻辑;I类错误和II类错误 | 1.假设检验;2.t检验;3.方差分析;4.显著性检验与多重比较 |
|
|
6 | 回归分析 | 回归模型的建立与解读 | 1.从方差分析到回归;2.线性回归模型;3.混合线性模型 |
|
|
考核办法为考查,要求学生根据选定的问题,分组或独立完成相关数据的收集,利用R语言完成数据分析,并形成研究报告。
[新西兰] Hadley Wickham / [美] Garrett Grolemund,《R数据科学》(原作名:R for Data Science: Visualize, Model, Transform, Tidy, and Import Data),人民邮电出版社,2018年7月
Bodo Winter,《Statistics for Linguists: An Introduction Using R》,Routledge,2020.
A sgplot2 Tutorial for Beautiful plotting in R (https://www.cedricscherer.com/2019/08/05/a-ggplot2-tutorial-for-beautiful-plotting-in-r/)
撰写人:孙彦 审核人: