新聞中心
這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
創(chuàng)新互聯(lián)Python教程:python實現(xiàn)信息熵的計算代碼
1、什么是信息熵?

為吉木乃等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計制作服務(wù),及吉木乃網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為成都網(wǎng)站建設(shè)、成都網(wǎng)站制作、吉木乃網(wǎng)站設(shè)計,以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!
1948年香農(nóng)提出了信息熵(Entropy)的概念。
信息理論:
1、從信息的完整性上進行的描述:
當系統(tǒng)的有序狀態(tài)一致時,數(shù)據(jù)越集中的地方熵值越小,數(shù)據(jù)越分散的地方熵值越大。
2、從信息的有序性上進行的描述:
當數(shù)據(jù)量一致時,系統(tǒng)越有序,熵值越低;系統(tǒng)越混亂或者分散,熵值越高。
“信息熵” (information entropy)是度量樣本集合純度最常用的一種指標。
二、python實現(xiàn)信息熵的計算代碼
1、導(dǎo)入庫
import numpy as np import pandas as pd
2、 準備數(shù)據(jù)
data = pd.DataFrame(
{'學歷': ['???, '專科', '???, '專科', '???, '本科', '本科', '本科', '本科', '本科',
'研究生', '研究生', '研究生', '研究生', '研究生'],
'婚否': ['否', '否', '是', '是', '否', '否', '否', '是', '否', '否', '否', '否', '是', '是', '否'],
'是否有車': ['否', '否', '否', '是', '否', '否', '否', '是', '是', '是', '是', '是', '否', '否',
'否'],
'收入水平': ['中', '高', '高', '中', '中', '中', '高', '高', '很高', '很高', '很高', '高', '高',
'很高', '中'],
'類別': ['否', '否', '是', '是', '否', '否', '否', '是', '是', '是', '是', '是', '是', '是', '否']})3、定義信息熵函數(shù)
# 定義計算信息熵的函數(shù):計算Infor(D) def infor(data): a = pd.value_counts(data) / len(data) return sum(np.log2(a) * a * (-1))
4、數(shù)據(jù)測試
# print(infor(data["學歷"])) #測試結(jié)果為: 1.584962500721156
分享題目:創(chuàng)新互聯(lián)Python教程:python實現(xiàn)信息熵的計算代碼
URL分享:http://m.fisionsoft.com.cn/article/djeejcg.html


咨詢
建站咨詢
