打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
就用了一下合并查询的模糊匹配,VLOOKUP实在太弱了!| PQ实战

      我原来一直对合并查询的模糊匹配功能不太感冒,因为模糊匹配的结果和过程不是可以精确控制的,就像给黑匣子一样!目前,很多人工智能的技术之所以没有在企业中应用,也正是这个原因——算法给出的结果,很多时候你可能甚至没有办法向领导解析为什么。

      直到最近,一个朋友的提问,引起了我的注意:大数据时代真的来了,模糊匹配的功能真的很有用!

- 1 -

牛X的模糊查询!

       问题是这样的,从2020年的企业名单里找出2019年有没有也在里面的:

       本来,如果公司的名称很规范统一,那问题非常非常简单,一个VLOOKUP就搞定了,但是,其中不乏这种情况:

       其中的有中英文括号不一样的问题;全/半角数字、字母的问题……

       类似情况模拟数据如下:

      这时,我想起了PQ里的合并查询增加了模糊匹配的功能,是不是可以试一下?

       展开后我们发现,前面这个括号问题的搞定了,但后面2个还没搞定:

      调整一下模糊匹配的选项,将阈值调整为0.7,可以看到,第4种情况也出来了,但第5项的还没有出来(自己动手试试哦):

      我们继续将阈值调低到0.6:

       结果全部搞定!!!

       此时,我们可以观察一下操作生成的步骤公式:

       其中使用了函数:Table.FuzzyNestedJoin,其中参数Threshold=0.6就是我们设定的阈值(其他参数可以结合相应选项理解),我们也可以进一步查看这个函数的相关帮助:

- 2 -

大数据时代一些法则

      随着大数据时代的来临,我们得到的数据会越来越多,其中有大量数据并不像公司系统里来的数据那么规范、统一(虽然很多企业里即使是系统的数据也不规范不统一

),数据分析结果也要求越来越快……

      此时,我们对数据处理或分析的精度要求可以适当下降——这一点与很多朋友日常工作中要严格精确到每一个单证、每一个货物编码、每一分钱的情况不同。

       因此,将来会有大量的类似“模糊”处理的功能出现,其中集成了大量的词库数据、人工智能(AI)技术等等,也越来越能保证数据处理大概率上正确、可用……

      但是,如果你要进一步问我,这个函数是怎样(用了什么算法)做到模糊匹配的?

      对不起,我不知道!我也不打算去深入研究,因为这样的“黑匣子”将会越来越多,作为使用者,大可不必也做不到都去把它了解清楚——尽管用就是了!

       关注公众号,发送“数据”下载配套文件练起来吧!

        恭喜你!使用Excel,你就已经走在人工智能的路上了!

【近期热门文章】

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
表格函数VLOOKUP精确匹配使用教程
Vlookup彻底不行了,多对多查询用PQ,点点鼠标就搞定
Excel如何实现横向数据源的数据表HLOOKUP匹配
VLOOKUP搭配MATCH函数,高效匹配多维度数据
自从学会了INDEX+MATCH,我就再也不用VLOOKUP了
Excel表格向左查询数据,八种函数轻松搞定,操作一波比一波简单
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服