顺序编码器--OrdinalEncoder类

admin

2024-02-16 01:28:15

0次

OrdinalEncoder
参数
- categories
- dtype
- handle_unknown
- unknown_value
- encoded_missing_value
属性
- categories_
- n_features_in_
- feature_names_in_
方法
- fit(X[, y])
- fit_transform(X[, y])
- get_feature_names_out([input_features])
- get_params([deep])
- inverse_transform(X)
- set_params(**params)
- transform(X)
使用示例

OrdinalEncoder

sklearn.preprocessing.OrdinalEncoder(*, categories='auto', dtype=, handle_unknown='error', unknown_value=None, encoded_missing_value=nan)

将分类特征转化为整数数组
编码器的输入应该是以整数或字符串为元素的类数组，表示由分类的(离散的)特征所获得的值，这些特征被转换为序列整数，这将导致每个特征产生一个整数列

The input to this transformer should be an array-like of integers or strings, denoting the values taken on by categorical (discrete) features. The features are converted to ordinal integers. This results in a single column of integers (0 to n_categories - 1) per feature

参数

参数可选值
auto	根据数据选择编码规则
list	`categories[i]`保存第i列中期望的类别

dtype

number type, default np.float64
期望的输出数据类型

handle_unknown

{‘error’, ‘use_encoded_value’}, default=’error’
当被设置为error时，当transform过程中遇到未知分类特征时将会抛出一个错误

unknown_value

int or np.nan, default=None
当参数handle_unknown被设置为use_encoded_value时，该参数是必须的

encoded_missing_value

int or np.nan, default=np.nan

缺失类别的编码值。如果设置为np.Nan，那么参数dtype必须是浮点型

属性

categories_

list of arrays
在拟合过程中确定每个特征的类别

The categories of each feature determined during fit (in order of the features in X and corresponding with the output of transform). This does not include categories that weren’t seen during fit.

n_features_in_

int
拟合过程中的特征数量

feature_names_in_

ndarray of shape (n_features_in_,)

拟合过程中的特征名称

Names of features seen during fit. Defined only when X has feature names that are all strings.

方法

fit(X[, y])

拟合数据

Fit the OrdinalEncoder to X.

fit_transform(X[, y])

拟合数据并进行转换

Fit to data, then transform it.

get_feature_names_out([input_features])

返回输出特征名称

Get output feature names for transformation.

get_params([deep])

返回模型参数

Get parameters for this estimator.

inverse_transform(X)

还原数据

Convert the data back to the original representation.

set_params(**params)

设置模型参数

Set the parameters of this estimator.

transform(X)

转换数据为序列代码

Transform X to ordinal codes.

使用示例

from sklearn.preprocessing import OrdinalEncoder
encoder = OrdinalEncoder()
x = [['Male', 1], ['Female', 3], ['Female', 2]]
x_transform=encoder.fit_transform(x)
x_transform
>>> array([[1., 0.],[0., 2.],[0., 1.]])
encoder.inverse_transform(x_transform)
>>>array([['Male', 1],['Female', 3],['Female', 2]], dtype=object)

词库加载错误:未能找到文件“E:\highferrum_mysql\Configuration\Dict_Stopwords.txt”。

上一篇：17--Django-项目实战-博客开发-登录功能和首页页面搭建

下一篇：Vue + ElementUI 实现动态更换任意主题色（动态换肤）

热门资讯

女生说今天好热啊该怎么回复女生说今天好热啊该怎么回复高情商回复如下：1、“你很热吗，那我给你讲个冷笑话中和一下吧，然后你就找个...

一家人过河的问题一家人爸爸 ... 一家人过河的问题一家人爸爸妈妈 2儿子 2女儿一个管家一条狗爱因斯坦的智力题目得买7张票，宠...

作为强国一代的青年大学生,在宏... 作为强国一代的青年大学生,在宏伟壮阔的科技强国梦中应该有着怎样的使命和担当？作为强国一代的青年大学生...

催眠大师的电影里所用到的心理学... 催眠大师的电影里所用到的心理学常识和原理是什么？《催眠大师》的引导方式是瞬间催眠，在现实人群中只有少...

我是个什么样的人，谁能帮我分析... 我是个什么样的人，谁能帮我分析一下，谢谢了？自己是什么样的人，没有和你接触，没有和你交往过，肯定不会...

求桔子树的早期作品集求桔子树的早期作品集《片段》《妖孽并出》《暗涌》《Ne me quitte pas》《左右之间》《我...

一个人一个世界那两个人几个世... 一个人一个世界那两个人几个世界？一个人一个世界，两个人也是一个世界，因为（另一个）是他喜欢的人，他...

巨魔盗贼PVP 怎么样? 巨魔盗贼PVP 怎么样?同上可以说没有优势~PVE还行~是要看种族天赋的~

云南盘鮈鱼能吃吗云南盘鮈鱼能吃吗能吃啊，而且很好吃的。

急求一篇写初中生的校园故事作文... 急求一篇写初中生的校园故事作文（记叙文）在学校发生的,真实点急求一篇写初中生的校园故事作文（记叙文）...

安徽基础教育平台学生完成后教师... 安徽基础教育平台学生完成后教师怎么遴选视频？安徽基础教育平台学生完成后，教师怎么遴选视频可以根据一些...

有人知道这是个什么鸟吗？有人知道这是个什么鸟吗？灰喜鹊…………＋幼雏喜鹊，还很小，看起来都很脆弱幼雏很难变认，有点像灰喜雀幼...

清扬控油洗发水是不是有激素洗了... 清扬控油洗发水是不是有激素洗了头发就不油，然后换其他洗发水就很油。现在根本没法用其他洗发水了。有一款...

阴阳师人生赢家成就是什么阴阳师人生赢家成就是什么人生赢家成就就是那个日御悄月同辉啊，同时达成全图鉴和非态拆没帆纳洲大阴阳师成...

主角武器是飞扬枪跋扈盾的网游小... 主角武器是飞扬枪跋扈盾的网游小说主角武器是飞扬枪跋扈盾的网游小说《正前方》更新超级慢

真的有白蛇白素贞这个人吗？真的有白蛇白素贞这个人吗？我刚刚看了百家讲坛，白素贞这个人是没有的，她是一个小说的角色。并且她的角色...

迪丽热巴拍过的电影或电视剧你认... 迪丽热巴拍过的电影或电视剧你认为如何？我认为还是很不错的，迪丽热巴的演技是很好的，她长得也是比较漂亮...

求南派三叔所有与盗墓笔记有关的... 求南派三叔所有与盗墓笔记有关的书、文章（各种番外、特别篇、贺岁篇）（只要名字就好），谢谢啦~《吴邪的...

范增和张良什么关系范增和张良什么关系范增是项羽谋士，张良为刘邦谋士，各为其主，战场上是敌对关系

像《觅渡》之类的书有哪些像《觅渡》之类的书有哪些写一些推荐的书知识性比较强的比较容易懂的钱穆湖上闲思录