检查Excel数据格式
选择目标数据库类型
将Excel转换为CSV
使用MySQL Workbench导入
适用场景:数据量较小(<100万行),操作可视化,适合非技术人员。
安装依赖库
pip install pandas sqlalchemy pymysql
编写Python代码
import pandas as pd from sqlalchemy import create_engine # 读取Excel文件 df = pd.read_excel('data.xlsx', sheet_name='Sheet1') # 连接数据库(示例为MySQL) engine = create_engine('mysql+pymysql://用户名:密码@主机名:端口/数据库名') # 保存到数据库表 df.to_sql('表名', con=engine, if_exists='append', index=False)
优势:支持大数据量、可自定义清洗逻辑(如去重、计算字段)。
转换Excel为JSON
import pandas as pd data = pd.read_excel('data.xlsx').to_dict(orient='records')
导入MongoDB
from pymongo import MongoClient client = MongoClient('mongodb://用户名:密码@主机名:端口/') db = client['数据库名'] collection = db['集合名'] collection.insert_many(data)
数据清洗必做项
drop_duplicates()
)。性能优化建议
安全与备份
Q:日期格式导入后错误?
A:在Excel中统一为“YYYY-MM-DD”格式,数据库中字段类型设为DATE。
Q:导入后中文乱码?
A:确保数据库、数据表字符集为utf8mb4
,CSV文件保存时选择UTF-8编码。
Q:部分数据丢失?
A:检查字段长度限制(如VARCHAR(255)可能截断超长文本)。
本文操作涉及工具及库的官方文档: