首页技术文章正文

Pandas数据预处理:更改明确指定数据的类型

更新时间:2022-09-27 来源:黑马程序员 浏览量:

IT培训班

  在Python中,当我们在处理数据时,可能会遇到数据类型不一致的问题。例如,通过爬虫采集到的数据都是整型的数据,在使用数据时希望保留两位小数点,这时就需要将数据的类型转换成浮点型。针对这种问题,既可以在创建Pandas对象时明确指定数据的类型,也可以使用astype()方法和to_numberic()函数进行转换,下面先来介绍明确指定数据的类型。

  创建Pandas数据对象时,如果没有明确地指出数据的类型,则可以根据传入的数据推断出来,并且通过dtypes属性进行查看。例如,创建一个Series对象,并查看其数据的类型,具体代码如下。

In [19]: import pandas as pd
         df=pd.DataFrame({'A':['5', '6', '7'], 'B':['3', '2', '1']})
         df.dtypes # 查看数据的类型
Out[19]:
         A     object
         B     object
         dtype:object

  除此之外,还可以在创建Pandas对象时明确地指出数据的类型,即在使用构造方法创建对象时,使用dtype参数指定数据的类型,示例代码如下。

In [20]: import pandas as pd
         # 创建DataFrame对象,数据的类型为int
         df=pd.DataFrame({'A': ['5', '6', '7'], 'B': ['3', '2', '1']},
                           dtype='int')
         df.dtypes

Out[20]:
         A     int32
         B     int32
         dtype:  object


分享到:
在线咨询 我要报名
和我们在线交谈!