導覽
近期變更
隨機頁面
新手上路
新頁面
優質條目評選
繁體
不转换
简体
繁體
3.21.244.94
登入
工具
閱讀
檢視原始碼
特殊頁面
頁面資訊
求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。
檢視 齊夫定律 的原始碼
←
齊夫定律
前往:
導覽
、
搜尋
由於下列原因,您沒有權限進行 編輯此頁面 的動作:
您請求的操作只有這個群組的使用者能使用:
用戶
您可以檢視並複製此頁面的原始碼。
{| class="wikitable" style="float:right; margin: -10px 0px 10px 20px; text-align:left" ! <p style="background: #D6A4AB; color: #000000; margin:auto; padding:5px 0; "> '''齐夫定律''' </p> |- |<center><img src="https://i0.wp.com/p1.ssl.qhimg.com/t01caf1e134491a0504.png" width="280"></center><small>[https://www.cheshirport.co/%E9%BD%8A%E5%A4%AB%E5%AE%9A%E5%BE%8B%E4%BE%8B%E5%AD%90-%E9%BD%8A%E5%A4%AB%E5%AE%9A%E5%BE%8B%EF%BC%9A%E8%AA%9E%E8%A8%80%E7%9A%84%E7%B5%B1%E8%A8%88%E5%AD%B8/ 圖片來自cheshirport] </small> |} '''齐夫定律'''(Zipf's law,[[IPA]])是由[[哈佛大學]]的[[語言學家]]喬治·金斯利·齊夫于1949年发表的实验定律。 它可以表述为:在[[自然语言]]的[[語料庫]]裡,一个单词出现的频率与它在频率表里的排名成[[反比]]。所以,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,而出现频率第二位的单词则是出现频率第四位的单词的2倍。这个定律被作为任何与[[冪定律]][[概率分布]]有关的事物的参考。<ref>[https://www.cheshirport.co/%E9%BD%8A%E5%A4%AB%E5%AE%9A%E5%BE%8B%E4%BE%8B%E5%AD%90-%E9%BD%8A%E5%A4%AB%E5%AE%9A%E5%BE%8B%EF%BC%9A%E8%AA%9E%E8%A8%80%E7%9A%84%E7%B5%B1%E8%A8%88%E5%AD%B8/ 齐夫定律],cheshirport</ref> ==例子== 最简单的齐夫定律的例子是“1/''f'' function”。给出一组齐夫分布的频率,按照从最常见到非常见排列,第二常见的频率是最常见频率的出现次数的½,第三常见的频率是最常见的频率的1/3,第n常见的频率是最常见频率出现次数的1/n。然而,这并不精确,因为所有的项必须出现一个整数次数,一个单词不可能出现2.5次。 在布朗语料库中,“the”、“of”、“and”是出現頻率最前的三個單詞,其出現的頻數分別為69971次、36411次、28852次,大約佔整個語料庫100萬個單詞中的7%、3.6%、2.9%,其比例約為6:3:2。大約佔整個語料庫的7%(100万单词中出现69971次)。满足齐夫定律中的描述。仅仅前135個字彙就佔了Brown語料庫的一半。 齐夫定律是一个[[歸納推理|实验定律]],而非[[演繹推理|理论定律]],可以在很多非语言学排名中被观察到,例如不同国家中城市的数量、公司的规模、收入排名等。但它的起因是一个争论的焦点。齐夫定律很容易用点阵图观察,坐标分别为排名和频率的[[对数]](log)。比如,“the”用上述表述可以描述为x = log(1), y = log(69971)的点。如果所有的点接近一条直线,那么它就遵循齐夫定律。 ==遵循该定律的现象== * 单词的出现频率:不仅适用于语料全体,也适用于单独的一篇文章 * 网页访问频率 * [[城镇人口]]与[[城镇等级]]的关系 * 收入前3%的人的收入 * 地震震级 * 固体破碎时的碎片大小 == 參考文獻 == {{reflist}} [[Category: 020 圖書資訊學總論]]
此頁面使用了以下模板:
Template:Main other
(
檢視原始碼
)
Template:Reflist
(
檢視原始碼
)
模块:Check for unknown parameters
(
檢視原始碼
)
返回「
齊夫定律
」頁面