极大补充ggplot2的统计分析能力(万字详细教程来了)


极大补充ggplot2的统计分析能力(万字详细教程来了)

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

上篇发布后👉极大补充ggplot2的统计分析能力,有小伙伴留言能否详细点介绍ggstatsplot,这就来了。
ggstatsplot=gg+stats+plot,可见其在ggplot2的基础上补充了统计能力stats,将数据分析工作流中的数据可视化和统计建模两个不同的阶段结合在一起,使数据挖掘变得简单和快速。
这些统计检验调用了statsExpressionspackage的功能,
ggstatsplot这里的统计结果展示参考了统计结果goldstandard标准格式,
具体到图中,如下图红圈部分,
个人感觉太过于fancy,实际使用时可以酌情处理。
下面简单介绍ggstatsplot主要函数使用

一个简单例子,使用默认参数,使用iris数据集,比较不同鸢尾花萼片长度差异。
修改配色、主题
package和palette参数可供选择的特别多,
grouped_ggbetweenstats,可以很方便的展示数据集子集的分布差异。
简单使用下,
类似于ggbetweenstats,不过他可以把各个箱子牵起来,下图会把均值牵起来。
这是R中的方法绘制边际分布图,python版本的边际分布图见👉Python边际图代码模版
边际上的图有以下5种图可修改,修改参数marginal. type即可。
同样也有grouped函数
绘制饼图,计算各个快之间是否有差异。
数据集分组,组间及组内计算统计指标。
功能类似于ggpiestats,图形非常好康。
可视化单一变量的分布,计算单一变量的均值与指定值(下例子中为5)之间是否存在统计学差异。
轻松绘制相关系数矩阵图,python中也可以轻松绘制该图:
热力图heatmap代码模版~
seaborn又一个扩展heatmapz
类似下面这种图
-推荐阅读-
👉R可视化教程:28个章节+11w字+数百张图
👇(请备注:428)


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录