网络行业分析

时间:2024-09-11 11:30:50编辑:思创君

互联网行业和传统行业的数据分析有何异同点?

说到数据分析,其实随着大数据这几年的发展,数据被认为是物理与信息融合中的关键技术,以及核心引擎。各行各业都在马不停蹄、轰轰烈烈地迈入了大数据时代。传统行业与互联网行业的界限开始发展交集和互补、渗透,传统的制造业再也不是闷头生产+再销售的模式,而是更多地聆听市场的声音,市场需要什么,消费终端就会相对应的给予其更多的多样化、个性化。目前来看,两者的主要区别还处在以下几点:一: 结构化数据和非结构化数据传统行业更多的是结构化数据, 即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据,像以应用oracle、Sql Server等数据库的制造型企业的ERP系统。而互联网行业更多的是非结构化数据,就是不能以二维形态描述的,例如所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等,像是医疗影像系统、教育视频点播、视频监控、国土GIS、设计院、文件服务器(PDM/FTP)、媒体资源管理等具体应用。二:数据的体量互联网行业海量的数据,由于互联网行业的特点,每时每刻都会产生海量的数据,它的数据往往是PB级的,1个PB有多大呢?它相当于2的50次方个字节。如果你对此没有概念,那么简单来说,《史记》约有52万多汉字,1个PB能够存储至少10亿部《史记》,以百度、腾讯、阿里为代表的企业。传统的一个生产制造工厂三个月制造的数据也不到100G。这是天大的一个差别。三:看待数据的方式及数据分析目的不同互联网行业会对这些海量的数据做数据分析,挖掘,无论是过去的数据还是即时的数据,数据不再是静止和陈旧的,任何被遗忘在服务器中的数据,都可能被重新利用,从而发现其中与我们、与行为、与现象的相关性,比如每逢“双十一”,“剁手党”都面临痛苦的抉择:打折的商品实在太多,买什么才好呢?最终一不小心,信用卡刷爆,买了一大堆自己不需要的商品,只得含泪吃半年的“康师傅”…谷歌公司每天都会收到来自全球超过30亿条的搜索指令,经过多年数据的累计,谷歌公司建立了“咳嗽”,“发热”等搜索关键字与流感地区的联系,于是在2009年谷歌成功地在美国预测了冬季流感的传播,并且精确到地区和州等等。而传统行业则不会过多去关注过去的数据,一般月底会盘点,出一些财务的数据分析报表,历史的数据会存放于备份库里,有问题才会去查找。四:数据查找的效率及安全性互联网行业往往存储着用户的个人行为信息,他要求保证绝对的安全或者准确性,比如12306,每到年底,面临数亿人迁徙的购票压力,在临近春节购票高峰峰值的时候,它的要求绝对是用户打开网页的速度可以慢一点没关系,但是要保证用户购票信息的绝对安全。如果用户付款购买了一张高铁动车票,你那边没收到钱款,那面对着上亿人的购票钱款,这个绝对是要出大问题的。而传统行业没有那么大的数据量和访问量,往往解决好并发,死锁等等问题,保证系统的高可靠性和稳定性,偶尔也会发生丢失一条采购记录或者生产记录的问题,由于一般用户都会除了系统录入以外,还会纸质的记录,那么这个也是可以被容忍的五:大数据技术快速获取有价值的信息基于以上互联网行业的特点,当数据量不断增大时,也随之带来了一系列的问题。比如假设解决某一问题有算法A 和算法B。在小量数据中运行时,算法A的结果明显优于算法B。也就是说,就算法本身而言,算法A能够带来更好的结果;然而,人们发现,当数据量不断增大时,算法B在大量数据中运行的结果优于算法A在小量数据中运行的结果。这一发现给计算机学科及计算机衍生学科都带来了里程碑式的启示:当数据越来越大时,数据本身(而不是研究数据所使用的算法和模型)保证了数据分析结果的有效性。即便缺乏精准的算法,只要拥有足够多的数据,也能得到接近事实的结论。由于能够处理多种数据结构,大数据能够在最大程度上利用互联网上记录的人类行为数据进行分析。大数据出现之前,计算机所能够处理的数据都需要前期进行结构化处理,并记录在相应的数据库中。但大数据技术对于数据结构的要求大大降低,互联网上人们留下的社交信息、地理位置信息、行为习惯信息、偏好信息等各种维度的信息都可以实时处理,立体完整地勾勒出每一个个体的各种特征。一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱,大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。简单来说,大数据需要Hadoop=HDFS(文件系统,数据存储技术相关)+HBase(数据库)+MapReduce(数据处理)+……Others这样的分布式存储,分布式处理大数据架构,而不仅仅是传统的磁盘阵列数据存储处理方式。互联网极大地改变了人们的生活,大量、高速、多变的信息每天都围绕在人们身边,我们需要更好的处理方式,去应对这种随时随地的变化。大数据技术将深远地改变互联网世界,改变整个生产生活的方式。随着技术的发展,大数据分析正在变得越来越容易,成本也越来越低,而且相比以前能更容易加速对业务的理解,越来越多的人开始进入大数据与数据分析行列,准备在这里干出自己的一番事业。编辑于 2019-10-21


怎样理解互联网行业“数据分析”的意义

互联网企业拥有大量的线上数据,而且数据量还在快速增长,除了利用大数据提升自己的业务之外,互联网企业已经开始实现数据业务化,利用大数据发现新的商业价值。以阿里巴巴为例,它不仅在不断加强个性化推荐、“千人千面”这种面向消费者的大数据应用,并且还在尝试利用大数据进行智能客户服务,这种应用场景会逐渐从内部应用延展到外部很多企业的呼叫中心之中。在面向商家的大数据应用中,以“生意参谋”为例,超过600万商家在利用“生意参谋”提升自己的电商店面运营水平。除了面向自己的生态之外,阿里巴巴数据业务化也在不断加速,“芝麻信用”这种基于收集的个人数据进行个人信用评估的应用获得了长足发展,应用场景从阿里巴巴的内部延展到越来越多的外部场景,如租车、酒店、签证等。因为客户的所有行为都会在互联网平台上留下痕迹,所以互联网企业可以方便地获取大量的客户行为信息。由互联网商务平台产生的信息一般具有真实性和确定性,通过运用大数据技术对这些数据进行分析,可以帮助企业制定出具有针对性的服务策略,从而获取更大的效益。近年来的实践证明,合理地运用大数据技术能够将电子商务的营业效率提高60%以上。大数据在过去几年中已经改变了电子商务的面貌,具体来讲,电子商务行业的大数据应用有以下几个方面:精准营销、个性化服务、商品个性化推荐。1.精准营销互联网企业使用大数据技术采集有关客户的各类数据,并通过大数据分析建立“用户画像”来抽象地描述一个用户的信息全貌,从而可以对用户进行个性化推荐、精准营销和广告投放等。当用户登录网站的瞬间,系统就能预测出该用户今天为何而来,然后从商品库中把合适的商品找出来,并推荐给他。图1显示了用户画像会包括哪些用户基本信息和特性。图1用户画像大数据支持下的营销核心在于,让企业的业务在合适的时间,通过合适的载体,以合适的方式,推送给最需要此业务的用户。首先,大数据营销具有很强的时效性。在互联网时代,用户的消费行为极易在短时间内发生变化,大数据营销可以在用户需求最旺盛时及时进行营销策略实施。其次,可以实施个性化、差异化营销。大数据营销可以根据用户的兴趣爱好、在某一时间点的需求,做到对细分用户的一对一的营销,让业务的营销做到有的放矢,并可以根据实时性的效果反馈,及时调整营销策略。最后,大数据营销对目标用户的信息可以进行关联性分析。大数据可以对用户的各种信息进行多维度的关联分析,从大量数据中发现数据项集之间有趣的关联和相关联系。例如,通过发现用户购物篮中的不同商品之间的联系,分析出用户的其他消费习惯。通过了解哪些商品频繁地被用户同时购买,帮助营销人员从用户的一种商品消费习惯,发现用户另外的商品消费规律,从而针对此用户制定出相关商品的营销策略。图2显示了网站会根据用户画像为不同客户推荐不同商品。图2精准营销例如,某电子商务平台通过客户的网络浏览记录和购买记录等掌握客户的消费模式,从而分析并分类客户的消费相关特性。如收入、家庭特征、购买习惯等,最终掌握客户特征,并基于这些特征判断其可能关注的产品与服务。从消费者进入网站开始,网站在列表页、单品页、购物车页等4个页面,部署了5种应用不同算法的推荐栏为其推荐感兴趣的商品,从而提高商品曝光率,促进交叉和向上销售。从多个角度对网站进行全面优化后,商城下定订单转化率增长了66.7%,下定商品转化率增长了18%,总销量增长了46%。在美国的沃尔玛大卖场,当收银员扫描完顾客所选购的商品后,POS机上会显示出一些附加信息,然后售货员会根据这些信息提醒顾客还可以购买哪些商品。沃尔玛在大数据系统支持下实现的“顾问式营销”系统能够建立预测模型,例如,如果顾客的购物车中有不少啤酒、红酒和沙拉,则有80%的可能需要买配酒小菜、作料。2.个性化服务电子商务具有提供个性化服务的先天优势,可以通过技术支持实时获得用户的在线记录,并及时为他们提供定制化服务。许多电商都已经尝试了依靠数据分析,在首页为用户提供全面的个性化的商品推荐。海尔和天猫提供了让用户在网上定制电视的功能,顾客可以在电视机生产以前选择尺寸、边框、清晰度、能耗、颜色、接口等属性,再由厂商组织生产并送货到顾客家中。这样的个性化服务受到了广泛欢迎。类似的定制服务还_现在空调、服装等行业。这些行业通过满足个性化需求使顾客得到更满意的产品和服务,进而缩短设计、生产、运输、销售等周期,提升商业运转效率。企业要为用户提供理想的个性化服务,首先必须通过数据充分了解用户的个性,其次是合理地掌控和设计服务的个性。了解用户个性是为用户提供他们想要的产品和服务的基础。企业需要在庞大的数据库中,找出最具有含金量的数据,然后,通过数据挖掘方法对用户进行聚类,再依据用户类型的特征设计针对性的服务。个性化分散的单位可大可小,大到一个有同样需求的客户群体,小到每一个用户都是一个个性化需求单位。企业必须掌握好个性化服务的粒度,过于分散的个性化服务,会增加企业的服务成本和管理的复杂程度,所增加的个性化成本和实际收益需要成正比。图3提供个性化旅游服务携程的大数据应用从用户的角度_发,分析基于携程所有用户的数据,包括用户在查询、浏览、预订、出行、评论等一系列旅行前后行为中所产生的数据。携程在剔除无效数据的同时,保证用户所留下的数据的真实性,然后将大量的数据进行实时筛选、分拣与重新组织并应用到用户的出行前、出行中、出行后的个性化需求中,如图3所示。要做到个性化,明确用户的目标需求是至关重要的,不仅要看订单,还要关心用户所关心的内容。例如,同样是预订五星级酒店,有些用户对酒店设施十分敏感,有些看重酒店位置,有些则更在意酒店服务,对此,携程会根据用户的需求推荐不同的酒店。美国塔吉特(Target)百货设立了一个迎婴聚会登记表,并对登记表中顾客的消费数据进行建模分析。他们发现,许多孕妇在第二个妊娠期的开始会买许多大包装的无香味护手霜,在怀孕的最初20周会大量购买补充钙、锌之类的保健品。塔吉特最终选出了25种典型商品的消费数据,构建了“怀孕预测指数”。通过这个预测指数,塔吉特能够在很小的误差范围内预测到顾客的怀孕情况,从而就能在合适的时间把孕妇优惠广告寄发给顾客。“Nike跑鞋或腕带传感器”使耐克逐渐成为大数据营销的创新公司。运动者只要穿着Nike的跑鞋运动,与之关联的iPod就可以存储并显示运动日期、时间、距离、热量消耗值等数据。Nike通过跑步者上传的跑步路线掌握了主要城市最佳跑步路线的数据库,而且组织城市的跑步活动效果更好。目前,Nike的运动网上社区有超过500万名活跃用户每天不停地上传数据,Nike借此与消费者建立了前所未有的牢固关系。同时,海量的数据对于Nike了解用户习惯、改进产品、精准投放和精准营销也起到了不可替代的作用,Nike甚至掌握了跑步者最喜欢听的歌是哪些。个性化服务离不开顾客的主动参与和分享,来源于客户的数据也能更精准地服务于客户。“三只松鼠”近几年的快速发展,一方面是依靠品牌推广,另一方面是在数据分析的基础上不断完善细节,包括个性化的称呼、“三只松鼠”的卡通形象、赠品的差别化、不同的顾客标签分类以及用户体验等。“三只松鼠”通过ERP系统能够了解所有顾客在商城的购买记录,通过CRM系统能够准确抓取用户的评价,一些不经意的留言和评级会反映出他们的需求。通过分析顾客过去在商城的购买习惯,用户的购买评价,来判断哪种口味的产品在哪个地区卖得最好,哪种产品是消费者最乐于接受的,从而进行更有针对性的产品首页推荐。同时,他们会对顾客进行个性化、人性化的标签分类和细化分析,从而根据这些分类,推送不同的产品类型。例如,爱老婆型顾客购买的产品主要是以老婆食用为主的,“三只松鼠”会在包裹里放上书信,以“松鼠”的口吻代替顾客给他老婆写一封信。3.商品个性化推荐随着电子商务规模的不断扩大,商品数量和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。个性化推荐系统通过分析用户的行为,包括反馈意见、购买记录和社交数据等,以分析和挖掘顾客与商品之间的相关性,从而发现用户的个性化需求、兴趣等,然后将用户感兴趣的信息、产品推荐给用户。个性化推荐系统针对用户特点及兴趣爱好进行商品推荐,能有效地提高电子商务系统的服务能力,从而保留客户。1)电子商务网站随着电子商务的蓬勃发展,推荐系统在互联网中的优势地位也越来越明显。在国际方面,Amazon平台中采用的推荐算法被认为是非常成功的。在国内,比较大型的电子商务平台网站有淘宝网(包括天猫商城)、京东商城、当当网、苏宁易购等。在这些电子商务平台中,网站提供的商品数量不计其数,网站中的用户规模也非常巨大。据不完全统计,天猫商城中的商品数量已经超过了4000万。在如此庞大的电商网站中,用户根据自己的购买意图输入关键字查询后,会得到很多相似的结果。用户在这些结果中也很难区分异同,难于选择合适的物品,推荐系统能够根据用户兴趣为用户推荐一些用户感兴趣的商品。电子商务网站利用推荐系统为用户推荐商品,方便了用户,从而也提高了网站的销售额。2)电影视频网站个性化推荐系统在电影和视频网站中的应用也很广泛,能够帮助用户在浩瀚的视频库中找到令他们感兴趣的视频。在该领域成功使用推荐系统的一家公司就是Netflix。Netflix原先是一家DVD租赁网站,后来开始涉足在线视频业务。Netflix非常重视个性化推荐技术,并且在2006年开始举办著名的NetflixPrize推荐系统比赛,希望研究人员能够将Netflix的推荐算法的预测准确度提升10%。该比赛对推荐系统的发展起到了重要的推动作用:一方面该比赛给学术界提供了一个实际系统中的大规模用户行为数据集(40万用户对2万部电影的上亿条评分记录);另一方面,在3年的比赛中,参赛者提出了很多推荐算法,大大降低了推荐系统的预测误差。图4是Netflix的电影推荐界面,包含了电影的标题和海报、用户反馈和推荐理由三部分。Netflix使用的是基于物品的推荐算法,即给用户推荐和他们曾经喜欢的电影相似的电影。Netflix宣称有60%的用户是通过其推荐系统找到感兴趣的电影和视频的。图4Netflix电影推荐YouTube作为美国最大的视频网站,拥有大量用户上传的视频内容。为了解决视频库的信息过载问题,YouTube在个性化推荐领域也进行了深入研究,现在使用的也是基于物品的推荐算法。实验证明,YouTube个性化推荐的点击率是热门视频点击率的两倍。3)网络电台个性化网络电台也很适合进行个性化推荐。首先,音乐很多,用户不可能听完所有的音乐再决定自己喜欢听什么,而且每年新的歌曲在以很快的速度增加,因此用户无疑面临着信息过载的问题。其次,人们听音乐时,一般都是把音乐作为一种背景乐来听,很少有人必须听某首特定的歌。对于普通用户来说,听什么歌都可以,只要能够符合他们当时的心情就可以了。因此,个性化音乐网络电台是非常符合个性化推荐技术的产品。目前有很多知名的个性化音乐网络电台。国际上著名的有Pandora和?Last.fm|Playmusic,findsongs,anddiscoverartists,国内的代表则是豆瓣电台。这3个个性化网络电台都不允许用户点歌,而是给用户几种反馈方式:喜欢、不喜欢和跳过。经过用户一定时间的反馈,电台就可以从用户的历史行为中获得用户的兴趣模型,从而使用户的播放列表越来越符合用户对歌曲的兴趣。Pandora的算法主要是基于内容的,其音乐家和研究人员亲自听了上万首来自不同歌手的歌,然后对歌曲的不同特性(如旋律、节奏、编曲和歌词等)进行标注,这些标注被称为音乐的基因。然后,Pandora会根据专家标注的基因计算歌曲的相似度,并给用户推荐和他之前喜欢的音乐在基因上相似的其他音乐。Last.fm|Playmusic,findsongs,anddiscoverartists?记录了所有用户的听歌记录及用户对歌曲的反馈,在这一基础上计算出不同用户在歌曲上的喜好相似度,从而给用户推荐和他有相似听歌爱好的其他用户喜欢的歌曲。同时,Last.fm|Playmusic,findsongs,anddiscoverartists?也建立了一个社交网络,来让用户能够和其他用户建立联系,以及让用户给好友推荐自己喜欢的歌曲。Last.fm|Playmusic,findsongs,anddiscoverartists?没有使用专家标注,而是主要利用用户行为计算歌曲的相似度。4)社交网络社交网络中的个性化推荐技术主要应用在3个方面:利用用户的社交网络信息对用户进行个性化的物品推荐,信息流的会话推荐和给用户推荐好友。Facebook保存着两类最宝贵的数据:一类是用户之间的社交网络关系,另一类是用户的偏好信息。Facebook推出了一个称为InstantPersonalization的推荐API,它能根据用户好友喜欢的信息,给用户推荐他们的好友最喜欢的物品。很多网站都使用了Facebook的推荐API来实现网站的个性化。著名的电视剧推荐网站Clicker使用InstantPersonalization给用户进行个性化视频推荐。Clicker现在可以利用Facebook的用户行为数据来提供个性化的、用户可能感兴趣的内容“’流”了,而更重要的是,用户无须在Clicker网站上输入太多数据(通过评分、评论或观看?Clicker.com?上的视频等方式),Clicker就能提供这样的服务。除了利用用户在社交网站的社交网络信息给用户推荐本站的各种物品外,社交网站本身也会利用社交网络给用户推荐其他用户在社交网站的会话。每个用户在Facebook的个人首页都能看到好友的各种分享,并且能对这些分享进行评论。每个分享和它的所有评论被称为一个会话,Facebook开发了EdgeRank算法对这些会话排序,使用户能够尽量看到熟悉的好友的最新会话。除了根据用户的社交网络及用户行为给用户推荐内容,社交网站还通过个性化推荐服务给用户推荐好友。5)其他应用因为电子商务企业基本上实现了业务流程的各个环节的数据化,所以可以充分利用大数据技术对这些数据进行挖掘分析来优化其业务流程,提高业务利润。除了前面介绍的几个应用之外,大数据在电子商务行业还可以应用在其他许多方面。①动态定价和特价优惠电子商务企业可以通过使用数据构建客户资料,并发现用户喜欢花费多少费用和喜欢购买什么产品,从而通过跟踪客户的消费行为,使用大数据分析来开发灵活的定价和折扣政策。例如,如果分析显示用户对特定类别商品的兴趣飙升,则电子商务企业可以提供打折或买一送一优惠。②定制优惠电子商务企业可以通过使用数据来确定客户的购买习惯,并根据以前的购买方式向他们发送有针对性的特价优惠和折扣代码。数据也可以用于在客户中止购买或只看不买时重新吸引客户,例如,通过发送电子邮件提醒客户他们查看过的产品或邀请他们完成购买。③供应链管理电子商务企业可以使用大数据更有效地管理供应链。数据分析可以揭示供应链中的任何延迟或潜在的库存问题。如果某个项目存在问题,则可以立即将其从销售中删除,以免破坏客户服务问题。④预测分析预测分析是指利用大数据技术分析电子商务业务的各种渠道,帮助企业制定未来运营的业务计划。数据分析可能会显示电商企业在线商店部门的新购买趋势或销售减缓的商品。使用这些信息就可以帮助规划下一阶段的库存,并制定新的市场目标。随时了解电子商务的最新趋势具有一定的挑战性,但是利用大数据技术可以大大提高企业的利润,并帮助企业建立一个成功的前瞻性思维业务。如果不利用挖掘大数据的力量,就可能会错过市场成功的机遇。

上一篇:这样紫啊

下一篇:浪迹天涯剧情