「Azure」数据分析师有理由爱Azure之一-Azure能带给我们什么?

2019-07-30

前面我们以相同的方式从数据分析师的视角介绍了Sqlserver,本系列亦同样地延续下去,同样是挖掘数据分析师值得使用的Azure云平台的功能。因云平台功能太多,笔者所接触的面也十分有限,有更专业的读者欢迎补充。

对云服务的一点点小认识

笔者接触Azure云时间不长,因没有IT背景,故对各大云市场也只能是浅尝即止,有关注Excel催化剂插件的读者们,也应该对笔者使用其他云市场有一些的了解。

Excel催化剂的自动更新机制是放到阿里云上完成的,对应的云服务是构建云服务器(比虚拟主机要高级,可以完全自己管控整台机器),但是软件授权都是没有的例如数据库(WindowsServer系统貌似国内使用免费)。

同样地在Excel插件功能上也使用了百度云的人工智能模块如自然语言处理、图像识别功能,翻译功能。

Excel插件的短信功能使用了腾讯云上短信接口服务。

因过往这些功能都是为了让个人用户可以有免费额度使用,也费尽了心思在各大云市场里寻找免费资源。

第15波-接入AI人工智能NLP自然语言处理https://www.jianshu.com/p/56a0616125fa

第86波-人工智能之图像OCR文本识别全覆盖 https://www.jianshu.com/p/7ac57a2af845

第85波-灵活便捷的批量发送短信功能(使用腾讯云接口) https://www.jianshu.com/p/2bd2d05dc541

总的来说,云服务就是可以给我们提供各种基础服务,如给我们一台电脑(服务器)或给我们一些空间存储(百度云之类的)或给我们一些调用接口(短信、人工智能等),可以让我们无需IT的支持,也可以用上很多的功能,并且是可以联网共享的,花钱方式也可以少用的少花,多用的多花,按需消费。

对Azure云的接触过程

对Azure云的了解是参加了一次微软举办的Azure动手实验营,虽然当时在课程上也是一脸懵逼,课程上都是以IT型的方向讲解,一来就讲怎么快速搭建个linux系统,怎么开Web应用程序,作为数据分析师的笔者根本一点不感兴趣。

幸运的是知道了怎样去学习和微软还是比较良心地提供了1元套餐1个月免费可以学习使用。

微软新开了一个频道叫Learn,里面的教程还是比较靠谱,偏动手实验方面的入门型,还有免费沙箱可以模拟环境使用,不像MSDN一上来就是文档化,没上手前根本看不动。

https://docs.microsoft.com/zh-cn/learn/browse/
还有搜索功能,不过不知道中文和英文的learn是不是也有区别,反正中文感觉教程不多,有些英文还没汉化的样子。

笔者就是从learn教程中,稍微熟悉了PowerShell调用Azure的基础知识。

搜索功能

Azure对数据分析师的价值

对于不是专业IT背景的数据分析师来说,大部分的基础性IT系统、环境,都不应该我们自己去搭建处理,可能第一印象云服务和我们关系不大,但笔者也还算找到一些比较刚需的东西,可以和大家一起分享下。

数据分析过程中,不可避免遇到非结构化的数据,这时各大云市场的人工智能接口,也是不错的选择,就像笔者前面所述已使用了百度云的人工智能接口,当然Azure上也有人工智能方面的,具体收费还没太多关注(百度貌似也快转向收费了,免费的资源越来越少)。

除此以外,笔者近期做的BI项目中,接触到了Azure SQL服务和Azure Analysis Services服务,重新对Azure的使用价值有了新认识。

作为数据分析师来说,前面一个专题系列给大家讲述了Sqlserver的价值,这里不再复述。此篇告诉大家一个非常利好的消息是,我们可以将使用Sqlserver的技能全盘搬到Azure SQL上来,Azure SQL就是云上的Sqlserver。

大部分IT人员经过比较后,都对Azure又爱又恨,爱的是提供的东西真的太好了,还可以用PowerShell进行自动化运维,和本地的IT环境可以无缝对接,若用的是微软全家桶(OFFICE365+Exchange邮件服务器+Active Directory活动目录等),真的非常爽。但费用摆在那里,贵得难以接受。

经笔者认真考察过,使用Azure SQL这们的云数据库功能,微软非常良心地给我们低廉的入门价格(在数据分析的用途上其实也用不上太高级的功能,性能慢一点,并发差一点也是可以忍受过去的,何况我们最终的Azure SQL的数据是为我们下一步Azure Analysis Services服务,最终只需分析服务作数据输出即可)。

笔者在项目中也正是使用Azure SQL+Azure Analysis Services的方案,实测效果还不错,价格也是非常无负担,作为个人都可以承担的手机话费一样几十块钱一个月而已。

极端入门只要30多块一个月

项目中使用的性能还可以的配置

Azure SQL按使用量和性能计费,永远是最新版的Sqlserver,这个对我们追求功能强大的分析师来说,无疑是极大的利好消息,其他家的云平台,所谓的包年套餐,都比Azure SQL要贵(性能要强这个不得知,反正分析需求用到的功能Azure SQL低配即可满足),并且越高版本的Sqlserver越贵。

所以若从数据分析师的角度来看,选择Azure SQL,真的是性价比越高,体验最棒。Azure SQL的按使用量收费,精确到分钟级别的,随时不够用加大性能,不用时关掉或降低性能,非常灵活,已经垫付了笔者对包年使用更便宜的固定思维了。

使用PowerShell对Azure服务资源进行关开升降操作,是一门很考手艺的活,也是笔者对PowerShell充满热情的所在,真金白银省下不少钱,例如上述的月费用,若优化下来,至少还可以节省一半以上(工作时间一天算12小时,其他时间关着)

另外在自助式BI工具PowerBI闹得火热的时候,其实论及功能扩展和性能满足来说,单单靠廉价的PowerBI Pro帐号体系里的公有云环境,模型一大,就没法太好操控,随着用户量的加大,PowerBI Pro性价比也不见得太优。

笔者在项目中接触到Azure Analysis Services,可以用它作为后端数据模型层,在前端展示上可以少量PowerBI Pro+Excel+PowerBIDesktop等方式来满足用户需要(PowerBI的玄丽可视化说实话,在传统Excel群体中特别是财务领域,也不见得是个多么刚需重要的东西,买几个PowerBI Pro做几个报表给高层看看就还好,大量底下一线分析人员,回到Excel或者只需PowerBIDesktop免费版即可)。

同样享受着Azure的低门槛进入的红利,在Azure Analysis Services的最低版本中,月费用也不过是1000+,非常容易入门。结合性能调优的资源开关升降操作,初始项目1000以内每月都可以实现。

Azure分析服务价格

在Azure Analysis Services中,有Sqlserver的Analysis Services一切优势,可满足开发企业级的BI项目需求,当然部门级的小范围使用就更容易了。有完善且免费的AAD(Azure Active Directory)帐号体系支持。比本地的Sqlserver用起来更舒服流畅,运维成本低,免高昂的数据库Sqlserver和Windows软件授权,真是难得一遇的好方案。

其他还在探索中的方案

Azure作为全球市值第一的微软的重头戏主推产品,时代所需,作为普通数据分析师,也需要顺势而为,认识并尽早使用这一重量级的云产品,必然能够给自己带来很大的红利价值。

作为数据分析师的角色,其实Azure上还有许多可挖掘的领域如机器学习领域,认知服务如人工智能领域还有云上数据中心的数据工厂等等,笔者也还在学习过程中,后续若有学成,再给读者们分享,也欢迎大家将自己所接触到的Azure其他的好东西分享一下,让笔者也能跟上。

笔者未来聚焦在数据领域的分享,不限于Excel,会分享更多Sqlserver、dotNET、Azure、PowerBI等话题,升级数据分析的能力,欢迎继续关注。

相关阅读

「Sqlserver」数据分析师有理由爱Sqlserver之一-好用的插件工具推荐https://www.jianshu.com/p/637aba4aeee5
「Sqlserver」数据分析师有理由爱Sqlserver之二-像使用Excel一般地使用Sqlserver https://www.jianshu.com/p/b40f8a36055e
「Sqlserver」数据分析师有理由爱Sqlserver之三-最值得使有低投入高产出的Sqlsever https://www.jianshu.com/p/8a5396a7a402
「Sqlserver」数据分析师有理由爱Sqlserver之四-七大数据库产品测评Sqlserver完胜 https://www.jianshu.com/p/243115b797ff
「Sqlserver」数据分析师有理由爱Sqlserver之五-数据库环境使用正则表达式不再是梦 https://www.jianshu.com/p/5900cfaa1300
「Sqlserver」数据分析师有理由爱Sqlserver之六-让Sqlserver拥有字符串聚合函数https://www.jianshu.com/p/ab3deac51973
「Sqlserver」数据分析师有理由爱Sqlserver之七-最刚需的数据导入导出功能-导入篇https://www.jianshu.com/p/e901b8cd4d2b
「Sqlserver」数据分析师有理由爱Sqlserver之八-最刚需的数据导入导出功能-导出篇 https://www.jianshu.com/p/adc82aa93efb

关于Excel催化剂

Excel催化剂先是一微信公众号的名称,后来顺其名称,正式推出了Excel插件,插件将持续性地更新,更新的周期视本人的时间而定争取一周能够上线一个大功能模块。Excel催化剂插件承诺个人用户永久性免费使用!

Excel催化剂插件使用最新的布署技术,实现一次安装,日后所有更新自动更新完成,无需重复关注更新动态,手动下载安装包重新安装,只需一次安装即可随时保持最新版本!

Excel催化剂插件下载链接:https://pan.baidu.com/s/1Iz2_NZJ8v7C9eqhNjdnP3Q

联系作者

公众号

取名催化剂,因Excel本身的强大,并非所有人能够立马享受到,大部分人还是在被Excel软件所虐的阶段,就是头脑里很清晰想达到的效果,而且高手们也已经实现出来,就是自己怎么弄都弄不出来,或者更糟的是还不知道Excel能够做什么而停留在不断地重复、机械、手工地在做着数据,耗费着无数的青春年华岁月。所以催生了是否可以作为一种媒介,让广大的Excel用户们可以瞬间点燃Excel的爆点,无需苦苦地挣扎地没日没夜的技巧学习、高级复杂函数的烧脑,最终走向了从入门到放弃的道路。

最后Excel功能强大,其实还需树立一个观点,不是所有事情都要交给Excel去完成,也不是所有事情Excel都是十分胜任的,外面的世界仍然是一个广阔的世界,Excel只是其中一枚耀眼的明星,还有其他更多同样精彩强大的技术、工具等。*Excel催化剂也将借力这些其他技术,让Excel能够发挥更强大的爆发!

关于Excel催化剂作者

姓名:李伟坚,从事数据分析工作多年(BI方向),一名同样在路上的学习者。
服务过行业:零售特别是鞋服类的零售行业,电商(淘宝、天猫、京东、唯品会)

技术路线从一名普通用户,通过Excel软件的学习,从此走向数据世界,非科班IT专业人士。
历经重重难关,终于在数据的道路上达到技术平原期,学习众多的知识不再太吃力,同时也形成了自己的一套数据解决方案(数据采集、数据加工清洗、数据多维建模、数据报表展示等)。

擅长技术领域:Excel等Office家族软件、VBA&VSTO的二次开发、Sqlserver数据库技术、Sqlserver的商业智能BI技术、Powerbi技术、云服务器布署技术等等。

2018年开始职业生涯作了重大调整,从原来的正职工作,转为自由职业者,暂无固定收入,暂对前面道路不太明朗,苦重新回到正职工作,对Excel催化剂的运营和开发必定受到很大的影响(正职工作时间内不可能维护也不可能随便把工作时间内的成果公布于外,工作外的时间也十分有限,因已而立之年,家庭责任重大)。

和广大拥护者一同期盼:Excel催化剂一直能运行下去,我所惠及的群体们能够给予支持(多留言鼓励下、转发下朋友圈推荐、小额打赏下和最重点的可以和所在公司及同行推荐推荐,让我的技术可以在贵司发挥价值,实现双赢(初步设想可以数据顾问的方式或一些小型项目开发的方式合作)。