---恢复内容开始---
题目要求:
数据处理第二阶段任务(必须全部用R代码实现)
1.数据清洗
2.获取每天的血糖日均值
3.根据数据文件,选择其中的任意三天,获取在哪些时段三天都会出现高血糖的状况(按照血糖值超出9来算)
R代码:
1 getwd();
2 setwd("F:/R/myfile");#更改工作区间,将data.txt放入该文件夹下。
3 mydata <- read.table("data.txt", header = F, skip = 3, col.names = c("ID", "Date", "Time", "class", "GlucoseHistory", "Remarks"));#将data.txt的数据读入,略去前三行,分别为每列数据添加名称。
4 mydata;#查看数据读入情况。
5 mean(mydata$GlucoseHistory[mydata$ID <= 4992]);#6/2
6 mean(mydata$GlucoseHistory[mydata$ID <= 5199 & mydata$ID >= 4993]);#6/3
7 mean(mydata$GlucoseHistory[mydata$ID <= 5359 & mydata$ID >= 5200]);#6/4
8 mean(mydata$GlucoseHistory[mydata$ID <= 5538 & mydata$ID >= 5360]);#6/5
9 mean(mydata$GlucoseHistory[mydata$ID <= 5704 & mydata$ID >= 5539]);#6/6
10 mean(mydata$GlucoseHistory[mydata$ID <= 5875 & mydata$ID >= 5705]);#6/7
11 mean(mydata$GlucoseHistory[mydata$ID <= 6054 & mydata$ID >= 5876]);#6/8
12 mean(mydata$GlucoseHistory[mydata$ID <= 6114 & mydata$ID >= 6055]);#6/9
13 mean(mydata$GlucoseHistory[mydata$ID <= 6221 & mydata$ID >= 6115]);#6/10 #获取2-10号每天的血糖日平均值。
14 mean(mydata$GlucoseHistory);#获取全部的血糖日平均值。
15 mydata1 <- subset(mydata, mydata$ID <= 5199 & mydata$ID >= 4993);#获取3号子集。
16 mydata2 <- subset(mydata, mydata$ID <= 5359 & mydata$ID >= 5200);#获取4号子集。
17 mydata3 <- subset(mydata, mydata$ID <= 5538 & mydata$ID >= 5360);#获取5号子集。
18 time1 <- mydata1$Time[mydata1$GlucoseHistory > 9];#获取3号符合条件的时间。
19 time2 <- mydata2$Time[mydata2$GlucoseHistory > 9];#获取4号符合条件的时间。
20 time3 <- mydata3$Time[mydata3$GlucoseHistory > 9];#获取5号符合条件的时间。
21 time1;
22 time2;
23 time3;
运行代码视图:
> getwd();
[1] "F:/R/myfile"
> setwd("F:/R/myfile");#更改工作区间,将data.txt放入该文件夹下。
> mydata <- read.table("data.txt", header = F, skip = 3, col.names = c("ID", "Date", "Time", "class", "GlucoseHistory", "Remarks"));#将data.txt的数据读入,略去前三行,分别为每列数据添加名称。
> mydata;#查看数据读入情况。
ID Date Time class GlucoseHistory Remarks
1 4858 2017/6/2 9:16 0 15.2 <NA>
2 4859 2017/6/2 9:33 1 14.3 <NA>
3 4861 2017/6/2 9:30 0 14.3 <NA>
4 4862 2017/6/2 9:46 1 15.4 <NA>
5 4864 2017/6/2 9:46 0 15.6 <NA>
6 4865 2017/6/2 10:01 0 16.2 <NA>
7 4866 2017/6/2 10:20 1 15.7 <NA>
8 4868 2017/6/2 10:16 0 16.1 <NA>
9 4869 2017/6/2 10:31 0 15.7 <NA>
10 4870 2017/6/2 10:59 1 16.8 <NA>
11 4872 2017/6/2 10:46 0 16.3 <NA>
12 4873 2017/6/2 11:07 1 17.6 运动
13 4875 2017/6/2 11:01 0 17.2 <NA>
14 4876 2017/6/2 11:22 1 17.6 <NA>
15 4878 2017/6/2 11:29 1 17.5 <NA>
16 4880 2017/6/2 11:16 0 17.8 <NA>
17 4881 2017/6/2 11:37 4 3.0 <NA>
18 4881 2017/6/2 11:37 1 18.3 <NA>
19 4883 2017/6/2 11:32 0 17.9 <NA>
20 4885 2017/6/2 11:50 1 16.9 <NA>
21 4887 2017/6/2 11:59 1 16.2 <NA>
22 4889 2017/6/2 11:46 0 17.0 <NA>
23 4890 2017/6/2 12:06 1 15.7 <NA>
24 4892 2017/6/2 12:14 1 15.0 <NA>
25 4894 2017/6/2 12:01 0 15.9 <NA>
26 4895 2017/6/2 12:17 1 14.7 <NA>
27 4897 2017/6/2 12:20 1 14.3 <NA>
28 4899 2017/6/2 12:26 1 13.9 <NA>
29 490