加入收藏 | 设为首页 | 会员中心 | 我要投稿 财气旺网 - 海宁网 (https://www.hainingwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

2022年值得关注的数据分析趋势

发布时间:2022-10-14 11:29:30 所属栏目:大数据 来源:
导读:  所有很酷的孩子都迟到了,对吗?

  我知道我们已经明显进入2022年,但我认为仍然值得分享我对今年数据和分析领域的一些预测。

  这些预测在很大程度上是在上个月从威尔士到伦敦的长途汽车上与我的一
  所有很酷的孩子都迟到了,对吗?
 
  我知道我们已经明显进入2022年,但我认为仍然值得分享我对今年数据和分析领域的一些预测。
 
  这些预测在很大程度上是在上个月从威尔士到伦敦的长途汽车上与我的一些成员谈话的结果。团队上个月在从威尔士到伦敦的长途汽车上与我的一些成员进行的谈话。这些预测,就像激发它们的对话一样,在有趣和严肃之间摇摆不定。
 
  未来,伙计。照片由 JOSHUA COLEMAN于 Unsplash
 
  1.数据栈走向小众化,数据团队在选择上出现倦怠[安全的赌注] 。
 
  不,不仅仅是你;2021年有很多新的数据初创公司涌现,每家公司似乎都在帮助你的堆栈中的一个越来越小的部分。Benn Stancil在一篇文章中说得很好。 recent post:
 
  相反,数据堆栈的前端是由一个爆炸性的工具所代表的,所有的工具都朝着稍微不同的方向发展。这里有传统BI;有现代BI;有无头BI;有开源BI;有基于比特币的BI。 有用于分析的笔记本,有用于SQL的笔记本,有用于协作的笔记本,有用于应用的笔记本和用于笔记本的应用。有数据可视化工具,有用于笔记本的数据可视化,和用于数据可视化的笔记本。 有用于团队的SQL编辑器,有用于不想写SQL的人的SQL编辑器,和用于Snowflake客户的SQL编辑器。 有我们无法摆脱的电子表格和取代我们无法摆脱的电子表格的电子表格;有重建的电子表格;有电子表格,但BI还有更多的东西。
 
  这种策略并不令人惊讶--初创企业在实现其全部愿景之前必须专注于解决小问题。令人惊讶的是,我们似乎相信这样一种说法:在我们的堆栈中拥有更多的专业工具比更少的通用工具更好。在某些情况下,情况可能是这样的,但对于我接触的大多数公司来说,这意味着麻烦。
 
  但是,职业倦怠感迫在眉睫...
 
  我们的团队已经被分得很细了,经常为他们的大部分任务更换工具:查询数据库,分析查询结果,将分析结果可视化,分享这些可视化的结果,建立数据模型,记录这些模型,控制这些模型的版本,等等。还有他们已经非常厌烦了.
 
  在这个工作流程中增加更多的工具是完全可怕的。正如我们从研究和个人经验中知道的那样,我们的注意力越是分散在不同的任务和工具中,我们就越是 "不理性、不聪明、不集中"。我担心今年会有太多的团队以艰难的方式学到这个教训。
 
  2.数据团队将制定 "任务声明 "并放弃它们[热议]
 
  我在2021年末开始听到这种趋势的低语,而在2022年的头几个月,它已经有了动力。创建数据团队使命宣言的冲动是可以理解的;它创造了一种目的感,一种在团队内重新设定期望的方式,更重要的是,与企业的其他部门。
 
  综上所述,我不禁对这个问题翻了个白眼。我想起了我作为分析师参加的会议,在会上我们讨论了我们团队的崇高目标,我们将如何用 "最高质量的数据和技术 "来 "促成更好的商业决策"。"但是大数据堆栈,我们在这个目标上失败的原因不是我们忘记了它,而是因为它真的很难做到。
 
  通过各种手段,举行任务陈述会议,但也请举行必要的后续会议,让你的团队谈论他们真正想要改变的事情,然后你可能会开始移动这个针。
 
  3.笔记本和数据目录进入企业[安全的赌注]
 
  2021年,随着人们不再问 "为什么我需要一个[笔记本|数据目录]",而是开始问 "我应该买哪一个?",笔记本和数据目录有了很大转变。" 最后,我们都想通了,我们需要比仪表盘更多的东西来做好我们的工作,而笔记本是对工具包的一个很好的补充。此外,数据目录感觉像是数据建模运动的一个自然结果,它有助于使干净的数据和那些漂亮的新笔记本容易被找到。
 
  最大的问题是今年谁会赢得这场比赛?现有的企业工具会不会像Snowflake和Azure已经做的那样,尝试建立他们自己的笔记本?是否会有人去做他们自己的数据编目功能?
 
  或者,它是否会成为突破性地成为企业普遍存在的小家伙之一?
 
  我总是支持一个弱者......。
 
  4.数据 "丛林之书 "走向Facebook之路[热议]
 
  在过去的5年里,Python一直是不可触及的。它已经从 "新的R "变成了每个数据工程师、数据科学家、甚至数据分析师的必知语言。但这种情况还会持续多久呢?
 
  对于数据工程师来说,正如Medhi Ouazza在他最近的文章""中所论述的那样。The Battle for Data Engineer’s Favorite Programming Language Is Not Over Yet" Rust可能会把数据工程师从他们的Python窝里引出来。Rust比Python的评价更高,学习曲线更陡峭,所以他们可以通过学习Rust获得更多的信誉积分,最重要的是,它实际上可能更适合于数据工程任务。
 
  在光谱的另一端,那些一直使用python(和)进行数据转换和探索的分析师们,从来没有更多的理由不使用它。像Snowflake这样的SQL数据仓库速度越来越快,而且每天都在提高普通SQL的能力,这使得离开你的SQL集成开发环境,用超慢的python做一些转换的决定每天都在增加成本。
 
  5.协作将不仅仅意味着 "谷歌数据文件"[安全打赌]
 
  通常,最好的创新是借用的,或者至少是受到其他东西的启发。在数据方面,我们最常看到的是许多流行工具上的 "X for data "标语。例如,dbt的数据工程的软件工程在业界掀起了一场风暴,因为它巧妙地将软件工程师能提供的最好的东西带给了数据工程师。
 
  当我们的类比不完全正确时,这种方法的缺点就会出现。在dbt的案例中,他们并没有重新创建软件工程师世界的所有方面--他们只取了需要的部分,使事情变得更好。他们理解数据工程与软件工程的不同之处,就像他们看到相似之处一样。
 
  不幸的是,不是每个人都那么聪明。最近,我们充斥着各种承诺 "协作 "的工具,但实际上他们所做的只是给你提供谷歌数据表,然后就收工了。没有人愿意和别人实时建立一个SQL查询,而在笔记本上添加评论只是抓住了我们日常合作的一小部分。坦率地说,它是不够的。
 
  2022年是一个人把一些创造性和分析性的想法放在数据合作应该是什么样子,并真正撼动事情的一年。
 
  6.有人会在元宇宙空间做数据......即使它在那里没有业务 [热议]
 
  向所有的元宇宙爱好者致歉,这真的不是在向你们开枪。目前,元宇宙是一个充满创新、想法和潜力的诱人的绿色空间。有人会想在这个充满可能性的世界里走来走去,希望他们能用手拨动数据,或在高大的柱状图的茎干中行走,或其他一些愚蠢的想法。今年将是元宇宙变得足够方便和令人兴奋的一年,我们将看到新的应用激增,在元空间中进行游戏,看看它是否有效,而数据不会被抛在后面。
 
  而且,说实话,我也会在那里试一试。
 
  7.最后一英里成为下一个数据网[安全的赌注]
 
  2021年,全世界都在热议神秘的数据网。它是什么?嗯,这取决于你和谁交谈。但你可以打赌,我们都想弄清楚。我听到了类似的狂热和同样不同的关于分析的最后一英里的想法。它是反向ETL吗?是无头BI吗?还是其他什么东西?
 
  我们已经写了它对我们的意义,但我们确信其他人会告诉你不同的东西。无论如何,今年你会听到很多关于最后一英里的消息,所以请系好安全带。
 
  8.我们记得亲身参与的数据活动对所有那些Slack渠道来说要好得多[热议]
 
  这一年,我们都记得与有共同兴趣的人在冰冷的比萨饼和温暖的啤酒中建立联系的魔力,记得在不舒服的椅子上了解最前沿的工作,而旁边的人则有一点太多身体喷雾。今年是我们从2020年3月加入的那些松弛渠道中抽身出来的一年,取消订阅一些新闻简报,并尝试重新找到现实和虚拟联系的正确平衡。为之干杯。
 
  9.自助服务找到新的热度[安全的赌注]
 
  不要说它是复出......因为它从未离开过。几年前,我听到很多关于自助服务的说法。我们都梦想着我们的业务伙伴能够自己完成大部分的分析工作,这样我们的数据团队就可以腾出手来做更有成效的工作。然后,我们似乎都得出了同一个令人沮丧的结论:除非我们把自己的事情处理好,否则自助服务是行不通的。所以我们花了几年时间专注于建立可靠的数据管道和讲述更好的数据故事,但现在我们已经准备好再次向外部世界打开大门。但是,这能行吗?
 
  你最好相信我们会尽力而为!如果 "最后一英里 "将像我预期的那样大,那么自助服务自然会在今年经历一次重振。也许今年它甚至会成为超越梦想的一年......
 
  10.决策科学家是今年的分析工程师[热门观点]
 
  正如我在之前的预测中所暗示的那样,今年将有一个很大的焦点是我们如何更好地将数据整合到业务中,特别是与决策的整合。其中一个比较明显的解决方案是为某人设立一个职位,确保数据在决策中得到有效利用。引出决策科学家。
 
  决策科学家,或运营研究人员,已经存在多年,像Meta这样的公司已经雇佣了决策科学家。但2022年将是决策科学家从边缘走向主流的一年。
 
  这些特立独行的人在数据、商业知识和心理学的交叉点上运作,专业地确保数据以最佳方式被使用,以影响可能的最佳商业结果。简而言之,在正确的组织和结构中,他们可以发挥巨大的作用。
 
  闭幕感想
 
  即使我的这些预测完全错误,有一件事我是肯定的。2022年将是一个令人兴奋的数据年。在第一个半月里,我们已经看到Twitter宇宙因数据堆栈 "捆绑 "的想法而活跃起来,我们看到新的工具出现,承诺以新的方式探索数据,一些重大的A系列公告承诺创新和增长即将到来。
 
  但你怎么想?我做对了什么,做错了什么?我完全错过了什么?
 
  今年,我将在我们的博客上报道其中的许多主题 More than Numbers.如果你想跟上2022年的热门趋势,请查看它。
 

(编辑:财气旺网 - 海宁网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!