专注于快乐的事情

机器学习概论

机器学习概论

机器学习概念几个概念的关系人工智能是计算机科学的一个分支,目的是开发一种拥有智能行为的机器,让机器像人类一样思考。机器学习是人工智能的一种实现方法。 大数据是人工智能的基础,而使大数据转变为知识或生产力,离不开机器学习(Machine...

凸函数

概念凸函数,一种函数,函数图像以上的区域为凸集。典型凸函数的形状类似于字母 U。 凸集凸集,欧几里得空间的一个子集,其中任意两点之间的连线仍完全落在该子集内。例如,下面的两个图形都是凸集。 很多常见的损失函数(包括下列函数)都是凸函数...

混淆矩阵

概念混淆矩阵是除了ROC曲线和AUC之外的另一个判断分类好坏程度的方法。下面的图中,结果只有2个值(1或者0) 混淆矩阵:打分值反应(预测=1)未反应(预测=0)合计真实结果呈现信号 (真实=1)A(击中) True Positive...

NumPy学习

简介NumPy 数组与 Python 内置的列表类型非常相似。但是随着数组在维度上变大,NumPy 数组提供了更加高效的存储和数据操作。与Python 列表list相比,固定类型的 NumPy 式数组缺乏这种灵活性,但是能更有效地存储...

Pandas分组技术

分组在数据处理中,需要先将数据进行拆分,然后在其对于的每个分组中进行运算。 df.groupby(‘key’)DataFrame 的 groupby() 方法进行绝大多数常见的分割 - 应用 - 组合操作。返回值不是一个 DataFr...

matplotlib入门学习

简单绘图matplotlib.pyplot包中包含了简单绘图功能。 import numpy as np import matplotlib.pyplot as plt func = np.poly1d(np.array([1, 2...

Pandas学习

简介Pandas是在NumPy 基础上建立的新程序库,提供了一种高效的DataFrame 数据结构。DataFrame 本质上是一种带行标签和列标签、支持相同类型数据和缺失值的多维数组。pandas的数据结构主要分成三种:Series...

Pandas的数据合并

简介在数据处理中,不免会遇到数据之间的合并。如将几个表的数据合成为一个,或者像SQL语句的关联查询。 方法横向连接Pandas数据框提供了merge方法以完成各种表的横向连接操作,这种连接操作与SQL语句的连接操作是类似的,包括内连接...