Владислав Харламов Asked:2020-09-26 23:42:25 +0800 CST2020-09-26 23:42:25 +0800 CST 2020-09-26 23:42:25 +0800 CST 比较 SQL 与 Pandas 772 据我了解,Pandas 的创建是为了更方便地使用数据库作为算法工作的一部分,但说实话,我并不真正理解 SQL 之间的区别。 为什么需要创建一些新的解决方案?每个的主要区别,优点和缺点是什么? python 1 个回答 Voted Best Answer MaxU - stop genocide of UA 2020-09-27T00:14:07+08:002020-09-27T00:14:07+08:00 与经典数据库不同,Python 为统计数据分析、构建机器学习模型和人工智能提供了非常广泛的功能(模块)。在创建 Pandas 之前,Python 生态系统没有用于处理表格数据的便捷工具/模块(Numpy只有在所有列具有相同数据类型时才能正常工作)。随着 Pandas 的出现,以下数据处理点已大大简化和加速: 从外部来源加载/卸载数据的过程: DB via SQL(SQL Alchemy用作通用层) JSON 镶木地板 HTML CSV 文本 擅长 SAS 乳胶 泡菜 数据清洗和预处理过程 对分类数据的本机支持 方便的接口,用于将处理后的数据进一步传输到机器学习模型和其他处理数据的 Python 模块 内置可视化 PS 很多时候 Pandas 与 SQL 结合使用——首先我们“快乐”并过滤数据库端的数据,然后我们将其读入 Pandas DataFrame,然后用这些数据做我们想做的任何事情,但已经使用了所有的财富Python 库。 PS 事实上,如果数据库可以做各种 Python 模块的所有事情,那么可能就不需要 Pandas 和许多其他模块
与经典数据库不同,Python 为统计数据分析、构建机器学习模型和人工智能提供了非常广泛的功能(模块)。在创建 Pandas 之前,Python 生态系统没有用于处理表格数据的便捷工具/模块(
Numpy
只有在所有列具有相同数据类型时才能正常工作)。随着 Pandas 的出现,以下数据处理点已大大简化和加速:从外部来源加载/卸载数据的过程:
SQL Alchemy
用作通用层)数据清洗和预处理过程
对分类数据的本机支持
方便的接口,用于将处理后的数据进一步传输到机器学习模型和其他处理数据的 Python 模块
内置可视化
PS 很多时候 Pandas 与 SQL 结合使用——首先我们“快乐”并过滤数据库端的数据,然后我们将其读入 Pandas DataFrame,然后用这些数据做我们想做的任何事情,但已经使用了所有的财富Python 库。
PS 事实上,如果数据库可以做各种 Python 模块的所有事情,那么可能就不需要 Pandas 和许多其他模块