導覽
近期變更
隨機頁面
新手上路
新頁面
優質條目評選
繁體
不转换
简体
繁體
18.226.226.158
登入
工具
閱讀
檢視原始碼
特殊頁面
頁面資訊
求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。
檢視 字母頻率 的原始碼
←
字母頻率
前往:
導覽
、
搜尋
由於下列原因,您沒有權限進行 編輯此頁面 的動作:
您請求的操作只有這個群組的使用者能使用:
用戶
您可以檢視並複製此頁面的原始碼。
{| class="wikitable" style="float:right; margin: -10px 0px 10px 20px; text-align:left" |<center>'''字母頻率'''<br><img src="https://pic1.zhimg.com/80/28e3fa6560d2ac80296183f5cea80447_720w.jpg?source=1940ef5c" width="280"></center><small>[https://www.zhihu.com/question/19805834 圖片來自zhihu]</small> |} '''字母频率'''(frequency of letters; character frequencies),指的是各个[[字母]]在文本材料中出现的[[频率]]。常被应用于[[密码学]],尤其是可破解[[古典密码学|古典密码]]<ref>[文章網址 古典密码学],來源,文章日期</ref> 的[[频率分析]]。在英语中最常见的字母是e。而在[[活版印刷|铅字印刷]]时代,人们已根据经验在[[Linotype排字机]]上将字母按常用与否排列成'''ETAOIN SHRDLU|ETAOIN SHRDLU|etaoin shrdlu cmfwyp vbgkjq xz''' 。还有,[[摩斯电码]]中越常用的字母,其编码符号就越短;而发出各字母的用时由快到慢顺序是'''e it san hurdm wgvlfbk opjxcz yq'''。[[数据压缩]]技术中也有相似的方法,如[[霍夫曼编码]]就是按来源符号出现的机率大小去编码。 ==英语中的字母频率== 英语中的字母频率如下: {{cite book |last1 = Beker |first1 = Henry |last2 = Piper |first2 = Fred | title = Cipher Systems: The Protection of Communications |publisher = [[約翰威立|Wiley-Interscience]] |year = 1982 |page = 397}} Table also available from {{cite book |last=Lewand |first=Robert |title=Cryptological Mathematics |publisher=[[美国数学协会|The Mathematical Association of America]] |year=2000 |page=36 |url=http://books.google.com/books?id=CyCcRAm7eQMC&pg=PA36 |isbn=978-0-88385-719-9 |accessdate=2013-06-05 }} and {{cite web |url=http://pages.central.edu/emp/LintonT/classes/spring01/cryptography/letterfreq.html |title=存档副本 |accessdate=2008-06-25 |archivedate=2008-07-08 |deadurl=yes |archiveurl=https://web.archive.org/web/20080708193159/http://pages.central.edu/emp/LintonT/classes/spring01/cryptography/letterfreq.html }} ==介绍== 有分析显示字母频率就像word frequencies|词频,不同作者或写作主题的作品中往往各不相同。当为[[x射线]](x-rays)撰文时,文章中就会有大量的字母X。而撰写用[[x射线]]治疗[[卡塔尔]](Qatar)的[[斑马]](zebras)时,一般很少出现的字母X、Q和Z就会充斥文中。可从作者的字母使用频率中看出他的某些写作习惯。例如,[[海明威]]的写作风格明显不同于[[威廉·福克纳|福克纳]]。字母、[[双字母组]]、trigram|三字母组、单词频率、单词长度和句子长度,这些都可以经统计后用以证明或反驳某一作品是某作者所写,甚至待鉴别作品与作者的写作风格相近也可用这一方法。 只能靠分析大量有代表性的文本才可得出准确的字母平均频率,而借由现代[[计算机]]和庞大的[[语料库语言学|文本语料库]],很容易完成这样的统计工作。 列出了各种文本材料(新闻报告、宗教文本、科学文本和一般小说)的字母频率顺序,其中在一般小说类里,字母“h”与“i”的排位差异尤甚,由Linotype排字机的“etao'''i'''n s'''h'''rdlu”变成了“etao'''h'''n '''i'''srdlu”。 Herbert Zim|赫伯特·S·基姆在他那部经典的密码学入门著作 《[[密码和隐密写作]]》(Codes and Secret Writing)里提道:英文的字母频率排列顺序是'''ETAON RISHD LFCMU GYPWB VKJXQ Z''',最常见的字母对是'''TH HE AN RE ER IN ON AT ND ST ES EN OF TE ED OR TI HI AS TO''',最常见的连写字母对是'''LL EE SS OO TT FF RR NN PP CC'''。 使用最多的前12个字母占了总使用次数的80%,使用最多的前8个字母则占了总使用次数的65%。数种rank functions|排名函数能很好地拟合字母频率,而双参数Cocho/Beta排名函数(two-parameter Cocho/Beta rank function)是当中的佼佼者。用另一种不能调节参数的排名函数也能不错地拟合字母频率分布,该函数也能拟合[[蛋白质]]序列中的[[氨基酸]]频率。 使用VIC cipher|VIC暗号或其他基于纵横棋盘格的暗号时,间谍常用助记符如“a sin to err”(最后的r不计)来记住最常用的8个字母。在密码解谜游戏cryptograms|cryptograms和单词解谜游戏如[[猜单词游戏]]、[[Scrabble]]、[[香蕉拼字游戏]]和电视游戏节目Wheel of Fortune (U.S. game show)|幸运轮中,须要运用字母频率和[[频率分析]]。在古典文学中,[[爱伦坡]]早在其著名小说《[[金甲虫]]》描述了如何用英文字母频率的知识去解开故事中的[[替换式密码]],找出[[威廉·基德|船长基德]]埋藏宝藏的所在。 字母频率在一些[[键盘布局]]的设计上举足轻重。Blickensderfer typewriter#Layouts|Blickensderfer打字机在下排放置最常用的字母。[[德沃夏克键盘]]将最常用的字母放在最易输入的中排,即除拇指外的八指所放之处。 == 參考文獻 == {{reflist}} [[Category: 310 數學總論]]
此頁面使用了以下模板:
Template:Cite book
(
檢視原始碼
)
Template:Cite web
(
檢視原始碼
)
Template:Main other
(
檢視原始碼
)
Template:Reflist
(
檢視原始碼
)
模块:Check for unknown parameters
(
檢視原始碼
)
模块:Citation/CS1
(
檢視原始碼
)
模块:Citation/CS1/Configuration
(
檢視原始碼
)
模块:Citation/CS1/Date validation
(
檢視原始碼
)
模块:Citation/CS1/Whitelist
(
檢視原始碼
)
返回「
字母頻率
」頁面