数据处理
使用源数据,excel进行数据处理
-
使用函数
IF(CELL("format",B5)="D1",B5," ")将数据进行筛选
-
数据格式转化
通话时间转化为秒单位
=IF(ISERROR(FIND("分",F2)),0,LEFT(F2,FIND("分",F2)-1)*60)+IF(ISERROR(FIND("秒",F2)),0,IF(ISERROR(FIND("分",F2)),MID(F2,1,FIND("秒",F2)-1),MID(F2,FIND("分",F2)+1,FIND("秒",F2)-FIND("分",F2)-1)))
流量单位转化为KB
=IF(ISERROR(FIND("M",E2)),IF(ISERROR(FIND("K",E2)),0,--MID(E2,1,FIND("K",E2)-1)),MID(E2,1,FIND("M",E2)-1)*1024+IF(ISERROR(FIND("K",E2)),0,MID(E2,FIND("M",E2)+2,FIND("K",E2)-(FIND("M",E2)+2))))
MySQL数据库查询相关数据
分析相关数据
1.分析个人语音通信中每个月的主叫和被叫的总次数及平均次数;
select 通信方式,月份 ,count(序号)from b group by 通信方式,月份;

select 通信方式,月份 ,count(序号)/6 as 平均次数 from b group by 通信方式,月份;

2.分析个人语音通信中每个月主叫和被叫联系人总人数及平均人数;
select 通信方式,月份 ,count(对方号码) as 次数 from b group by 通信方式,月份;

select 通信方式,月份 ,count(对方号码)/6 as 平均人数 from b group by 通信方式,月份;

3.分析个人语音通信中每个月主叫和被叫通信总时长及平均时长;
select 通信方式,月份 ,sum(时长) as 总时长 from b group by 通信方式,月份;

select 通信方式,月份 ,sum(时长)/6 as 平均时长 from b group by 通信方式,月份;

4.分析个人每月前5名语音主叫联系人和被叫联系人及其通信时长;
select 月份,通信方式,对方号码,sum(时长) from b where 月份=i group by 月份,通信方式,对方号码 order by 月份,通信方式,sum(时长) desc limit 5;

5.分析个人每月语音通信中郑州市和非郑州市主叫和被叫的总时长
select 通信方式,月份,sum(时长) as 平均时长 from b WHERE 通信地点 like “%郑州%” group by 通信方式,月份;

select 通信方式,月份,sum(时长) as 平均时长 from b WHERE 通信地点 not like “%郑州%” group by 通信方式,月份;

6.分析个人短信通话中日平均短信数和月平均短信数
select 通信方式,COUNT(序号)/5 as 月平均短信 from a group by 通信方式;

select 通信方式,COUNT(序号)/150 as 日平均短信 from a group by 通信方式;

7.分析个人短信通话中每月前5名联系人
select 月份,通信方式,对方号码,COUNT(对方号码) as 数量 from a WHERE 月份=i group by 月份,通信方式,对方号码 ORDER BY COUNT(对方号码) desc;

8.分析个人近6个月来日平均网络流量和月平均网络流量
SELECT sum(流量) /5 AS 月平均流量 FROM c;

SELECT sum(流量) /150 AS 日平均流量 FROM c;

9.分析个人通信行为模式,如通话高峰、短信高峰及网络高峰
把时间段分为8组 0-3点为第一个时间段,timegroup值为0; 3-6点为第二个时间段,timegroup值为1;6-9点为第三个时间段,timegroup值为2;以此类推,timegroup的取值为0-7;
select floor(hour(时间)/3) as timegroup,sum(时长) as “该时间段内通信时长(秒)” from b group by timegroup order by sum(时长) desc;

select floor(hour(时间)/3) as timegroup,count(序号) as “时间段内短信条数” from a group by timegroup order by count(序号) desc;

select floor(hour(时间)/3) as timegroup,sum(流量) as “时间段内流量kb” from c group by timegroup order by sum(流量) desc;

从以上的分析中,我们可以得知:通话高峰为下午6点到9点;短信高峰为上午9点到12点;流量使用高峰为上午6点到9点。
