打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Python 中的一些小技巧总结,新手必备知识点

这里是本人收集的一些 Python 小技巧,目前主要是一些实用函数,适合有一定基础的童鞋观看(不会专门介绍使用到的标准库函数)。。

有需要Python学习资料的小伙伴吗?小编整理一套Python资料和PDF,感兴趣者可以关注小编后私信学习资料(是关注后私信哦)反正闲着也是闲着呢,不如学点东西啦

一、函数式编程

函数式编程用来处理数据,感觉很方便。(要是再配上管道操作符 | 或者 Java 的那种链式调用,超级爽!可惜 Python 都没有。。需要借助第三方库)

1. 分组/group

数据处理中一个常见的操作,是将列表中的元素,依次每 k 个分作一组。

def group_each(a, size: int):
"""
将一个可迭代对象 a 内的元素, 每 size 个分为一组
group_each([1,2,3,4], 2) -> [(1,2), (3,4)]
"""
iterators = [iter(a)] * size # 将新构造的 iterator 复制 size 次(浅复制)
return zip(*iterators) # 然后 zip

这个函数之前在 Python 拾遗 - 奇技淫巧 中就写过。

顺便如果某个 k 比较常用(比如 2),还可以用 partial 封装一下

from functools import partial
# 每两个分一组
group_each_2 = partial(group_each, size=2) # 等同于 group_each_2 = lambda a: group_each(a, 2)

2. 扁平版本的 map

稍微接触过函数式应该都知道 flat_map,可 Python 标准库却没有提供。下面是我在 stackoverflow 上找到的实现,其实很简单

from itertools import chain
def flat_map(f, items):
return chain.from_iterable(map(f, items))

它和 map 的差别在于是不是扁平(flat) 的(废话。。),举个例子

>>> list(map(list, ['123', '456']))
[['1', '2', '3'], ['4', '5', '6']]
>>> list(flat_map(list, ['123', '456']))
['1', '2', '3', '4', '5', '6']

3. 上述函数的应用举例

在做爬虫工作时,有时会遇到这样的 table 元素:

对这种 html 元素,我一般会直接把它转换成 list,结果如下:

table = [['label1', 'value1', 'label2', 'value2'],
['label3', 'value3'],
['label4', 'value4', 'label5', 'value5'],
...
]

为了方便索引,现在我需要把上面的数据转换成下面这个样子的 dict

{
'label1': 'value1',
'label2': 'value2',
'label3': 'value3',
'label4': 'value4',
'label5': 'value5'
}

如果是平常,大概需要写循环了。不过如果用刚刚说到的几个函数的话,会变得异常简单

# 1. 分组
groups = flat_map(group_each_2, table)
# 1.1 flat_map 返回的是迭代器,list 后内容如下:
# [('label1', 'value1'),
# ('label2', 'value2'),
# ('label3', 'value3'),
# ('label4', 'value4'),
# ('label5', 'value5')]
# 2. 转换成 dict
key_values = dict(groups) # 得到的 key_values 与上面需要的 dict 别无二致。

二、其他

1. 多 dict 的去重

假设我们有一个 dict 的列表,里面可能有内容一模一样的 dict,我们需要对它做去重。

容易想到的方法就是使用 set,可是 set 中的元素必须是 hashable 的,而 dict 是 unhashable 的,因此不能直接放进 set 里。

>>> a = [{'a': 1}, {'a': 1}, {'b': 2}]
>>> set(a)
Traceback (most recent call last):
File "/usr/local/lib/python3.7/site-packages/IPython/core/interactiveshell.py", line 2961, in run_code
exec(code_obj, self.user_global_ns, self.user_ns)
File "<ipython-input-5-5b4c643a6feb>", line 1, in <module>
set(a)
TypeError: unhashable type: 'dict'

难道就必须手写递归了么?未必,我在 stackoverflow 看到这样一个小技巧

import json
def unique_dicts(data_list: list):
"""unique a list of dict
dict 是 unhashable 的,不能放入 set 中,所以先转换成json

unique_dicts([{'a': 1}, {'a': 1}, {'b': 2}]) -> [{'a': 1}, {'b': 2}]
"""
data_json_set = set(json.dumps(item) for item in data_list)
return [json.loads(item) for item in data_json_set]
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Clumper库 | 常用的数据操作函数
Python3实现xml转json文件
用Python写个迷你出门问问|10几行代码搞定
combine和partition
python之内置函数(map,fillter,reduce)
Python学习笔记(3)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服