【Python】100个pandas使用小技巧,让你精通apply函数


【Python】100个pandas使用小技巧,让你精通apply函数

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

100个pandasapply(lambda)实战技巧。
在pandas的数据处理工具箱里,apply(lambda)堪称最灵活的函数之一。这个能沿DataFrame/Series轴批量执行自定义逻辑的工具,既可以对单个元素进行平方、大小写转换等基础操作,也能胜任跨行多列乘积、滚动统计等复杂运算。
本文整理了100个真实场景下的应用案例,从元素级转换到特征工程全流程,带你通过具体代码掌握apply(lambda)的核心用法,解锁pandas数据处理的高效实践。
1. 对列中的每个元素求平方:
2. 计算列中每个字符串的长度:
3. 将字符串转换为大写:
4. 检查值是否大于阈值:
5. 从文本列中提取第一个单词:
6. 计算每行的平均值:
7. 计算每列中缺失值的数量:
8. 计算列的累积和:
9. 对列中的每个元素应用自定义函数:
10. 将负值替换为零:
11. 从列中的每个字符串提取最后两个字符:
12. 检查列中每个字符串是否存在子字符串:
13. 计算两列的乘积:
14. 将时间戳转换为月份:
15. 计算列中每个值的指数:
16. 检查值是偶数还是奇数:
17. 计算列的累积乘积:
18. 从电子邮件地址中提取域名:
19. 根据映射字典替换值:
20. 计算列的滚动平均值:
21. 检查值是否为质数:
22. 从字符串中提取数字:
23. 将值归一化到0和1之间:
24. 检查字符串是否包含任何元音:
25. 计算每行绝对值的和:
26. 检查列是否仅包含唯一值:
27. 将字符串列转换为单词列表:
28. 计算列的滚动标准差:
29. 检查日期是周末还是工作日:
30. 去除字符串的前导和尾随空格:
31. 将列转换为分类类型:
32. 计算每行平方值的和:
33. 检查列是否包含任何空值:
34. 将日期列转换为星期几:
35. 计算列的百分比变化:
36. 计算每个字符串中的单词数:
37. 将时间戳列转换为特定时区:
38. 检查列是否包含任何非数值值:
39. 从日期列中提取年份:
40. 计算列中每个值的z分数:
41. 将字符串列转换为标题大小写:
42. 检查列是否单调递增:
43. 计算列的移动平均值:
44. 检查列是否包含任何空白字符:
45. 计算列中每个值的阶乘:
46. 检查列是否包含任何特殊字符:
47. 将列转换为日期时间格式:
48. 检查列是否包含任何异常值:
49. 计算两列的加权平均值:
50. 检查列是否包含任何重复值:
51. 计算列中出现次数的累积计数:
52. 检查列是否包含任何负值:
53. 将秒数列转换为小时:
54. 检查列是否包含任何前导零:
55. 计算列的中位数绝对偏差(MAD):
56. 将数值列转换为二进制表示:
57. 检查列是否包含任何重复模式:
58. 计算每列的偏度:
59. 检查列是否包含任何非字母数字字符:
60. 计算具有指定窗口的列的滚动和:
61. 检查列是否包含任何高于动态计算阈值的值:
62. 计算每列中缺失值的百分比:
63. 检查列是否包含任何回文字符串:
64. 从时间戳列中提取小时:
65. 检查列是否包含任何2的幂值:
66. 计算每行的几何平均值:
67. 检查列是否包含任何具有指定前缀的字符串:
68. 将十六进制字符串列转换为十进制整数:
69. 检查列是否包含任何5的倍数的值:
70. 计算每列的四分位距(IQR):
71. 检查列是否包含任何在指定范围内的值:
72. 计算两列之间的余弦相似度:
73. 检查列是否包含任何具有特定后缀的字符串:
74. 将以秒为单位的持续时间列转换为分钟:
75. 检查列是否包含任何质数:
76. 计算两列之间的滚动相关性:
77. 检查列是否包含任何在特定位置具有特定子字符串的值:
78. 将布尔列转换为整数(0或1):
79. 检查列是否包含任何同时是3和5的倍数的值:
80. 使用指定的权重计算列的加权和:
81. 检查列是否包含任何连续重复的值:
82. 计算具有指定窗口的列的滚动最大值:
83. 检查列是否包含任何偶数且大于10的值:
84. 将字符串列转换为小写:
85. 检查列是否包含任何具有特定单词的值:
86. 计算具有指定窗口的列的滚动最小值:
87. 检查列是否包含任何完全平方数的值:
88. 计算具有指定窗口的列的滚动中位数:
89. 检查列是否包含任何符合特定正则表达式模式的值:
90. 计算具有指定窗口的列的滚动分位数:
91. 检查列是否包含任何是3或5的倍数的值:
92. 将日期列转换为一年中的第几天:
93. 检查列是否包含任何具有特定长度的值:
94. 计算具有指定窗口的列的滚动标准差:
95. 检查列是否包含任何给定除数的倍数的值:
96. 将时间差列转换为小时:
97. 检查列是否包含任何具有特定字符数的值:
98. 计算具有指定窗口的列中平方值的滚动和:
99. 检查列是否包含任何斐波那契数的值:
100. 计算具有指定窗口的列中绝对值的滚动和:


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录