有趣的地方

有趣的地方

深入理解NumPy与Pandas【numpy模块及Pandas模型使用】

二、numpy模块及Pandas模型使用 numpy模块 1.ndarray的创建 import numpy as np a=np.array([1,2,3,4]) b=np.array([[1,2,3,4],[5,6,7,8]]) print(a) #[1 2 3 4] print(b) #[[1 2 3 4][5 6 7 8]] 1.1使用array()函数创建 numpy.array(object, dtype = None, copy = True, order = None,

【Python】pandas连续变量分箱

路过了学校花店 荒野到海边 有一种浪漫的爱 是浪费时间 徘徊到繁华世界 才发现你背影 平凡得特别 绕过了城外边界 还是没告别 爱错过了太久 反而错得完美无缺 幸福兜了一个圈                      🎵 林宥嘉《兜圈》 import pandas as pd import numpy as np from sklearn.model_selection import cross_val_score from sklearn.linear_model import Logi

【机器学习-10】主成分分析(PCA)算法:原理、应用与实现

一、引言 1.数据分析的重要性   在当今的信息爆炸时代,数据已经渗透到各个行业和领域的每一个角落,成为决策制定、科学研究以及业务发展的重要依据。数据分析则是从这些数据中提取有用信息、发现潜在规律的关键手段。通过数据分析,我们能够更深入地了解问题的本质,把握市场趋势,优化业务流程,提高决策效率,从而为企业和社会创造更大的价值。 2.引出降维的需求与意义   然而,在实际的数据分析过程中,我们往往面临着数据维度过高的问题。高维数据不仅增加了计算复杂度和存储成本,而且可能导致“维度灾难”

数据分析——大数据伦理风险分析

大数据伦理风险分析 前言 一、大数据伦理 二、大数据技术伦理风险 算法安全性、可信赖性及稳定性风险及其应对 算法风险的表现 算法风险的危害 算法风险的应对 算法的可解释性风险及其应对 算法可解释性风险的内容 算法可解释性风险的损害 算法可解释性风险的应对 算法的决策不可预见性风险及其应对 数据收集与储存中的泄漏风险及其应对 案例 三、 大数据应用中的伦理风险 算法歧视 算法滥用 利用算法对用户进行不良诱导 过度依赖算法 利用大数据开展不正当竞争 数据垄断

Python数据分析的数据导入和导出

数据分析的数据的导入和导出 前言 一、导入数据 导入Excel表格数据 read_excel 示例 导入CSV格式数据 read_csv() 示例 导入JSON格式数据 JSON简介 pandas导入JSON数据 read_json() 导入txt文件 read_table 示例 导入(爬取)网络数据 read_html() 示例 二、输出数据 CSV格式数据输出 to_csv 示例 xlsx格式数据输出 to_excel 示例1 示例2

python相关库的安装:pandas,numpy,matplotlib,statsmodels

 如果按照以下步骤依旧安装不了,私信,评论,说出问题,我帮你解决 目录 ​编辑 windows+r  打开窗口 输入 cmd 方法一:pip install +库名 方法二:很快 方法三:镜像安装 步骤:  1.首先找到python.exe的地址 第一种情况打开cmd,输入where python,查看python.exe的地址。 第二种情况: 在cmd命令框输入命令: 以安装statsmodels为例 以上三种方法最后在Pycharm查看是否下载成

Python大数据之pandas快速入门(二)_python提取指定行内容

先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7 深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前! 因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。 既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化! 由于文件比较多,这里只是将部分目录截图出来,

CentOSPython使用openpyxl、pandas读取excel报错

一、openpyxl报错 由于本人在centos7下使用python的openpyxl报错,所以决定使用强大的pandas。 pandas是一个快速、强大、灵活且易于使用的开源数据操作和分析工具,建立在Python语言之上。 pandas是一个广泛使用的数据分析库,它提供了高效的数据结构和数据分析工具。pandas可以从多种数据源读取数据,包括excel、word、txt、cvs、html、sql等等,并提供了一些列强大的数据操作和分析功能,如数据清洗、转换、统计计算、相关性分析等。

Python 数据分析模块pandas 如何创建DataFrame

以下用两种方式分别创建DataFrame。 import pandas as pd #原始数据存储在列表中 names = ['Alice','Deric','Amanda','Petter'] ages = ['34','24','33','35'] incomes = ['50000','65000','46000','69000'] # 使用字典创建 DataFrame data = {'names':names, 'ages':ages, 'inco

九.pandas绘图基础

目录 九.pandas绘图基础 1-柱状图 --参数stacked=True堆积 --参数figsize=(宽,高) --自定义横坐标 --设置字体&显示负号 2.箱型图 3. 折线图 九.pandas绘图基础 Pandas的DataFrame和Series,在matplotlib基础上封装了一个简易的绘图函数, 使得我们在数据处理过程中方便可视化查看结果。 好处: 方便快捷的可视化的方式洞察数据, 覆盖常用图标类型. 不足: 不如Matplot
<< 1 2 3 4 5 6 7 8 9 10 > >>

Powered By Z-BlogPHP 1.7.3

© 2018-2020 有趣的地方 粤ICP备18140861号-1 网站地图