自动划分数据集脚本

自动将数据集划分为测试集、验证集、测试集(1 - train - val) 文件夹格式: 1234567891011121314151617source_dir/||-- class1/| |-- 1.png| |-- 2.png| |-...

数据处理

Labelme检测标注转Yolo格式

labelme标注图片标签为json格式: 123456789101112131415161718192021222324252627{ "version": "5.2.1", "fla...

数据处理

Pandas缺失数据处理

缺失值与空值**缺省值:**数据集中数值为空的值, pandas使用Nan / NaT 表示 **空值:**空字符串 "" 1234s1 = [10, 10.5, None, 11]s2 = [7, 6.9,7.5,No...

数据处理

Pandas数据导入与保存

目的: 数据导入:excel, csv文件 数据导出 基本统计 缺省数据处理 数据导入数据是分析基础,实际工作中,数据来自于企业内部数据,网络数据,开源数据集; 方法 说明 pd.read_csv(filepath_or_bu...

数据处理

Pandas基础——DataFrame数据结构

DataFrame: 多种类型的列构成的二维标签数据结构(多列) DataFrame类: pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) 参数: da...

数据处理

Pandas基础——Series数据结构

Series数据结构1. 创建Series对象pd.Series 是 Pandas 库中用于创建一维数组的函数 data: 可以是多种数据类型,如列表、元组、字典、NumPy 数组等 index: 可以是列表、元组等可迭代对象,其长度需要和 data...

数据处理