python实现将数据标准化到指定区间[a,b]+正向标准化+负向标准化

目录

一、公式介绍

(一)正向标准化公式

(二)负向标准化公式如下

(三)[a,b]取[0,1]的特例

二、构建数据集

三、自定义标准化函数 

四、正向标准化

五、负向标准化 

六、合并数据


一、公式介绍

将一列数据X标准化到指定区间[a,b]

(一)正向标准化公式

nor_X=(b-a)*(X-X_min)/(X_max-Xmin)+a

(二)负向标准化公式如下

nor_X=(b-a)*(Xmax-X)/(X_max-Xmin)+a

(三)[a,b]取[0,1]的特例

若[a,b]的取值为[0,1],

那么正向标准化公式就变为了如下:

nor_X=(X-X_min)/(X_max-Xmin)

负向标准化公式就变味了如下:

nor_X=(Xmax-X)/(X_max-Xmin)

也就是我们常用的在[0,1]区间的最大最小标准化

二、构建数据集

import pandas as pd
import numpy as np
#对医院进行综合分析
data=pd.DataFrame({
    '医院':['医院1', '医院2', '医院3', '医院4', '医院5', '医院6', '医院7', '医院8', '医院9', '医院10'],
    '门诊人数':[368107, 215654, 344914, 284220, 216042, 339841, 225785, 337457, 282917, 303455],
    '病床使用率%':[99.646, 101.961, 90.353, 80.39, 91.114, 98.766, 95.227, 88.157, 99.709, 101.392],
    '病死率%':[1.512, 1.574, 1.556, 1.739, 1.37, 1.205, 1.947, 1.848, 1.141, 1.308],
    '确诊符合率%':[99.108, 98.009, 99.226, 99.55, 99.411, 99.315, 99.397, 99.044, 98.889, 98.715],
    '平均住院日':[11.709, 11.24, 10.362, 12, 10.437, 10.929, 10.521, 11.363, 11.629, 11.328],
    '抢救成功率%':[86.657, 81.575, 79.79, 80.872, 76.024, 88.672, 87.369, 75.77, 78.589, 83.072]
})

#令"医院"这一属性为索引列
data.set_index("医院",inplace=True)

三、自定义标准化函数 

def min_max_scaling(data, method='positive', feature_range=(0, 1)):
    '''
    Min-Max归一化处理
    
    参数:
    data (pd.DataFrame): 需要进行处理的数据框
    method (str): 归一化的方法,'positive' 为正向,'negative' 为逆向,默认为'positive'
    feature_range (tuple): 归一化后的最小最大值范围,默认为 (0, 1)
    
    返回:
    pd.DataFrame: 归一化后的数据框
    '''
    y_min, y_max = feature_range
    #y_min、y_max分别是归一化后数据的最小值 和最大值范围
    normalized_data = pd.DataFrame()
    #创建了一个名为normalized_data的空pandas DataFrame对象,可以向这个数据框中添加数据
    
    for col in data.columns:
        col_max = data[col].max()
        col_min = data[col].min()
        #获取DataFrame data 中每一列的最大值和最小值
        
        if method == 'negative':
            scaled_col = (y_max - y_min) * (col_max - data[col]) / (col_max - col_min) + y_min 
            #这样是使数据映射到(y_min,y_max)区间
            #如果y_min=0,y_max=1,那么scaled_col = ((col_max - data[col]) / (col_max - col_min) 也就是到(0,1)区间的标准化映射了
            #下边的负向标准化同理
            
            
            #负向标准化
        elif method == 'positive':
            scaled_col = (y_max - y_min) * (data[col] - col_min) / (col_max - col_min) + y_min
            #正向标准化
        
        normalized_data[col] = scaled_col
        #将标准化后的数据增加到上边创建的空数据框中
    
    return normalized_data
#返回标准化后的数据框

四、正向标准化

由数据可知,['门诊人数', '病床使用率%', '确诊符合率%', '抢救成功率%']这四列数据应该是正向指标,即数值越大越好。

# 正向指标标准化
positive_cols = ['门诊人数', '病床使用率%', '确诊符合率%', '抢救成功率%']
positive_normalized = min_max_scaling(data[positive_cols], method='positive', feature_range=(0.002, 1))
# positive_normalized = min_max_scaling(data[positive_cols], method='positive', feature_range=(0, 1))

将数据进行标准化的区间为[0.002,1]

五、负向标准化 

 由数据可知,['病死率%', '平均住院日']这四列数据应该是负向指标,即数值越小越好。

# 负向指标标准化
negative_cols = ['病死率%', '平均住院日']
negative_normalized = min_max_scaling(data[negative_cols], method='negative', feature_range=(0.002, 1))
# negative_normalized = min_max_scaling(data[negative_cols], method='negative', feature_range=(0, 1))

六、合并数据

# 数据合并且保持顺序
combined_normalized_data = positive_normalized.join(negative_normalized)
# combined_normalized_data = combined_normalized_data[data.columns]
# combined_normalized_data.index = data.index

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/557233.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

VUE-列表

VUE-列表 列表功能 如下例子 列表展示 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><meta http-equiv&qu…

网络分析工具

为了实现业务目标&#xff0c;每天都要在网络上执行大量操作&#xff0c;网络管理员很难了解网络中实际发生的情况、谁消耗的带宽最多&#xff0c;并分析是否正在发生任何可能导致带宽拥塞的活动。对于大型企业和分布式网络来说&#xff0c;这些挑战是多方面的&#xff0c;为了…

AI边缘计算盒子+ThingSense管理平台,推动明厨亮灶智慧监管新篇章

背景随着“互联网”时代的浪潮汹涌而至&#xff0c;国家及各地政府纷纷在“十四五”规划中明确指出&#xff0c;强化食品安全管理&#xff0c;利用技术手段实现智慧监管是刻不容缓的任务。为此&#xff0c;各地正加速推进“互联网明厨亮灶”的建设步伐&#xff0c;实现系统对接…

C# 报输入字符串格式不正确的原因

先放错误代码 23 class Voicewater 24 { 25 public void voicealarm(int tem) 26 { 27 Console.WriteLine("现在的温度是{}度了",tem); 28 } 29 } 解决方法…

14 Php学习:表单

表单 PHP 表单是用于收集用户输入的工具&#xff0c;通常用于网站开发。PHP 可以与 HTML 表单一起使用&#xff0c;用于处理用户提交的数据。通过 PHP 表单&#xff0c;您可以创建各种类型的表单&#xff0c;包括文本输入框、复选框、下拉菜单等&#xff0c;以便用户可以填写和…

Create an SAP Fiori App Using SAP Business Application Studio/连接时服务不可用

Create an SAP Fiori App Using SAP Business Application Studio 如果连接时遇到服务不可用 我们需要配置BTP上的连接。 参考文档 更改之后需要刷新 studio界面&#xff0c;重新选择就可以正常工作了

Linux 基于 UDP 协议的简单服务器-客户端应用

目录 一、socket编程接口 1、socket 常见API socket()&#xff1a;创建套接字 bind()&#xff1a;将用户设置的ip和port在内核中和我们的当前进程关联 listen() accept() 2、sockaddr结构 3、inet系列函数 二、UDP网络程序—发送消息 1、服务器udp_server.hpp initS…

【随笔】Git 高级篇 -- 远程服务器拒绝 git push reset(三十二)

&#x1f48c; 所属专栏&#xff1a;【Git】 &#x1f600; 作  者&#xff1a;我是夜阑的狗&#x1f436; &#x1f680; 个人简介&#xff1a;一个正在努力学技术的CV工程师&#xff0c;专注基础和实战分享 &#xff0c;欢迎咨询&#xff01; &#x1f496; 欢迎大…

vue中使用水印

1. 在utils下创建watermark.js const watermark {}/**** param {要设置的水印的内容} str* param {需要设置水印的容器} container* param {需要设置水印的每一块的宽度} canWidth* param {需要设置水印的每一块的高度} canHeight* param {需要设置水印的字体} canFont* para…

【IDEA】JRebel LS client not configured

主要原因就是因为 jrebel 的版本跟 idea的版本对不上&#xff0c;或者说jrebel的版本比idea的版本还高&#xff0c;导致出现该错误 查看idea版本 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/a7ba43e6822947318cdb0d0e9d8d65e9.png 获取jrebel 版本 如何处理 …

“好”玩游戏让我本能痴迷游戏编程

源地址&#xff1a;https://www.ctvol.com/c-cdevelopment/5842.html 我的游戏生涯是从最开始的热血传奇开始的&#xff0c;那时候&#xff0c;我们年少轻狂&#xff0c;不知道多少80后的青春都洒在了这个游戏上面&#xff0c;那时候&#xff0c;热血传奇的热度比现在的英雄联…

【C++20】学习笔记:在事件驱动使用携程

2021年文章:比物理线程都好用的C++20的协程,在事件驱动代码中的应用解析 大神给出了可以用的例子:例子代码执行 源码 //https://bbs.huaweicloud.com/blogs/266537 #include <iostream> #include <vector>//这只是一个极简的模型示例,真实的代码要远比它复杂得…

在PostgreSQL中如何处理跨表的级联删除和更新?

文章目录 解决方案1. 使用外键约束和级联操作创建外键约束并指定级联删除创建外键约束并指定级联更新 2. 使用触发器&#xff08;Triggers&#xff09;创建触发器实现级联删除 示例代码示例1&#xff1a;使用外键约束和级联删除示例2&#xff1a;使用触发器实现级联删除 在Post…

Python根据公募基金在一定时期内持有的股票数据进行社会网络分析

【背景】根据提供的公募基金在一定时期内持有的股票数据&#xff0c;构建一个社会网络分析框架&#xff0c;度量每个基金在每年的度中心度、介数中心度和特征向量中心度&#xff0c;并对相关数据做出简要说明。 【代码】 import networkx as nx import pandas as pd import n…

Rust 语言 GUI 用户界面框架汇总(持续更新)

拜登&#xff1a;“一切非 Rust 项目均为非法”&#x1f60e; 什么是 GUI 图形用户界面&#xff08;Graphical User Interface&#xff0c;简称 GUI&#xff0c;又称图形用户接口&#xff09;是指采用图形方式显示的计算机操作用户界面。 现在的应用开发&#xff0c;是既要功…

机器人路径规划:基于Q-learning算法的移动机器人路径规划,可以自定义地图,修改起始点,提供MATLAB代码

一、Q-learning算法 Q-learning算法是强化学习算法中的一种&#xff0c;该算法主要包含&#xff1a;Agent、状态、动作、环境、回报和惩罚。Q-learning算法通过机器人与环境不断地交换信息&#xff0c;来实现自我学习。Q-learning算法中的Q表是机器人与环境交互后的结果&#…

设计模式系列:适配器模式

简介 适配器模式&#xff08;Adapter Pattern&#xff09;又称为变压器模式&#xff0c;它是一种结构型设计模式。适配器模式的目的是将一个类的接口转换成客户端所期望的另一种接口&#xff0c;从而使原本因接口不匹配而不能一起工作的两个类能够一起工作。 适配器模式有两种…

润开鸿与蚂蚁数科达成战略合作,发布基于鸿蒙的mPaaS移动应用开发产品

4月18日&#xff0c;江苏润和软件股份有限公司&#xff08;以下简称“润和软件”&#xff09; 旗下专注鸿蒙方向的专业技术公司及终端操作系统发行版厂商江苏润开鸿数字科技有限公司&#xff08;以下简称“润开鸿”&#xff09;与蚂蚁数科举行战略合作签约仪式&#xff0c;并发…

腾讯后端一面:当 TCP 建立连接之后,TCP 和 UDP 的实时性是不是就差不多了?

更多大厂面试内容可见 -> http://11come.cn 腾讯后端一面&#xff1a;当 TCP 建立连接之后&#xff0c;TCP 和 UDP 的实时性是不是就差不多了&#xff1f; 项目相关 面试官可能是 Go 方向的&#xff0c;我面试的是 Java 方向的&#xff0c;所以面试官也没有问我简历上的项…

Uniswap丨justswap丨pancakeswap去中心化薄饼交易所系统开发

开发去中心化薄饼交易所系统&#xff08;如Uniswap、JustSwap、PancakeSwap&#xff09;是一个复杂而有挑战性的任务&#xff0c;需要综合考虑技术、安全、用户体验和合规等方面。以下是开发这样一个系统时需要考虑的关键方面&#xff1a; 1. 技术架构 智能合约开发&#xff1…
最新文章