2015年认证杯SPSSPRO杯数学建模B题(第二阶段)替换式密码全过程文档及程序

2015年认证杯SPSSPRO杯数学建模

B题 替换式密码

原题再现:

  历史上有许多密码的编制方法。较为简单的是替换式密码,也就是将文中出现的字符一对一地替换成其它的符号。对拼音文字而言,最简单的形式是单字母替换加密,也就是以每个字母为一个单位,将每个字母替换成另外的字母或者另外的符号。较为复杂的形式是以多个字母为一个单元,整体替换成其它的字符。这个映射方法被称为密码表,拿到密码表的人就能够将密文破译成明文。单字母替换加密是在古代就使用过的一种加密方法,但由于其容易被破解,所以在现代需要加密的场合已经很少使用。
  单字母替换加密的破译方法有频率分析等。这种密码和破译方法在小说中也经常提到,例如爱伦·坡的《金甲虫》和柯南·道尔在福尔摩斯系列故事《归来记》中的“跳舞小人”。但当获取的密文篇幅不是很大时,光凭借频率分析是不足以破译全部密文的。往往还要熟知该种语言的人,经过对可能出现的词汇及字母组合进行分析,才能完整地破译密码。
  第二阶段问题: 在密码的实际使用中,我们获取的密文往往是经过各种干扰的。例如密文不完整,或者在通信传输的过程中,密文存在被丢失、添加和篡改字符的可能。为简单起见,我们假设密文是通过一个带有噪声干扰的信道传输的。在通信过程中,每个字符经过信道传输的结果都属于如下四种情形之一:
  1. 该字符在传输过程中被丢失,其概率为 p1;
  2. 该字符本身正常传输,在其之后添加了一个随机字符,其概率为 p2;
  3. 该字符在传输过程中被篡改为一个随机字符,其概率为 p3;
  4. 该字符正常传输,其概率为 1 − p1 − p2 − p3。
  在加密后,单词之间的间隔和标点符号全部被删去。请你改进之前的破译算法,使其能够在这种带有干扰的条件下完成破译工作,并推广对破译能力的评价指标,使其能应用于这种带有干扰的条件。

整体求解过程概述(摘要)

  密码学起源于数千年以前,长期以来出现了许多密码的编制方法,较为简单的是替换式密码。对拼音文字而言,最简单的形式是单字母替换加密,也就是以每个字母为一个单位,将每个字母替换成另外的字母或者另外的符号。基于对文献的查找和分析,我们最后要得到的明文是英文语料库中的词语,而第二阶段的题目中明确提出加密后,每个单词之间的空格,以及标点符号都会被删除,并且我们获取的密文是通过一个带有噪声干扰的信道传输的,在通信过程中存在增删改的情况,而我们需要改进第一阶段中破解密文的方法,使其能在带有干扰的条件下完成破译工作。那我们就要针对不同的情况,建立不同的模型,以便在不同情况下得到密文对应的明文。
  在第二阶段,我们将分以下几种情况进行讨论:
  1. 我们获取了一段通过噪声干扰信道传输的密文,通过定性和定量分析得到干扰不会影响密文中字母出现频率,在改进第一阶段算法的基础上我们对没有标点和空格的密文进行了结构化处理,依次采用字母频率分析、高频字母结构化处理、任意文章同步推演和结构化单词间隔划分,尽可能多的找到密文-明文对应关系,以便于实现被干扰密码的破解。
  2. 我们获取了一段有干扰的密文,欲找到使密文被读成明文最大的条件概率。可利用贝叶斯公式并且省掉一个常数项,等价变换为破译的密文即为明文的可能性乘以明文为有意义信息的可能性,得到概率。做出两个假设:(1)明文字母为马尔科夫链,也就是说,后一个字母只由前一个字母决定。(2)不同时刻的接收信号只由发送信号决定。根据独立输出假设,可以得到A的密文长度次幂种组合,那么我们就可以很容易利用算法 Viterbi 找出上面式子的最大值,进而找出要识别的明文。
  3. 我们获取了一段密文,在假设可以最大限度地排除干扰破解密文的情况下,首先初步判断它能不能被直接破译,如果能直接破译,说明在通信过程中没有受到干扰,此时我们将采用 DES 算法破译由古典密码衍生出的分组密码。我们的每一种方法都配有相关实例,以便于推广对破译能力的评价指标。

问题分析:

  对拼音文字而言,最简单的形式是单字母替换加密,也就是以每个字母为一个单位,将每个字母替换成另外的字母或者另外的符号。基于对文献的查找和分析,我们的最后要得到的明文是英文语料库中的词语,而我们需要对不完整,或者在通信传输的过程中,被丢失、添加和篡改字符的密码找到破解的方法,打个比方来说,明文就像锁在屋子里面的宝贝,密钥是打开屋子所需要的钥匙,而密文是外面的人,我们就是要从众多相似钥匙中做出判断,找到打开屋子真正的钥匙,拿到屋子里面的宝贝。那我们就要针对可能出现的钥匙,建立不同的模型,以便在不同情况下得到密文对应的明文。
  在第二阶段,我们将分以下几种情况进行讨论:
  1) 由于通信信道噪声干扰的存在,我们在获取了一段密文之后,首先通过定性和定量分析找出干扰(增删改)对字母统计的影响,分析过后得到干扰并不会影响字母统计,于是我们的模型就是在第一阶段的基础上进行改进。由于题目中明确提出加密后单词之间的空格和标点都会被删去,所以这个模型更注重于结构化,依次对密文进行:字母频率分析、高频字母的结构化处理、任意文章进
行同步推演、结构化单词间隔划分、部分密码表试解密并循环推算,尽可能的
找出更多的明密文对应关系,以便于最后破解带干扰的密文。
  2) 我们获取了一段有干扰的密文,欲找到使密文被读成明文最大的条件概率。可利用贝叶斯公式并且省掉一个常数项,等价变换为破译的密文即为明文的可能性乘以明文为有意义信息的可能性,得到概率。做出两个假设:(1)明文字母为马尔科夫链,也就是说,后一个字母只由前一个字母决定。(2)不同时刻的接收信号只由发送信号决定。根据独立输出假设,可以得到A的密文长度次幂种组合,那么我们就可以很容易利用算法 Viterbi 找出上面式子的最大值,进而找出要识别的明文。
  3) 我们获取了一段密文,在假设可以最大限度地排除干扰破解密文的情况下,首先初步判断它能不能被直接破译,如果能直接破译,说明在通信过程中没有受到干扰,此时我们将采用 DES 算法破译由古典密码衍生出的分组密码。

模型假设:

  1. 由于英文语料库中包含大量信息,我们建立的模型所定义的明文只是语料库里面的一部分信息;
  2. 我们所选取的语料库中的信息有一定的代表性,在模型的推广中能起作用;
  3. 能最大限度地排除干扰破解密文得到合理化的明文;
  4. 索引所花时间在控制范围和接受范围内;
  5. 明文、密文一一对应;

论文缩略图:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可

部分程序代码:(代码和文档not free)

char aticle[5000];
char cipher[5000];
char randomarticle[5000];
//函数声明区
int readcipher();
int preparecipher();
int creatcipher();
int letterfrequency();
int findwordsstructure();
int RandomArticleStructure();
int RandomArticleletterfrequency();
int Useletterfrequency(char somewords[]);
int Usefindwordsstructure(char usearticle,char letter,int m,int n);
int AddBlankCipher();
int Trydecipher();
//函数区
int preparecipher()//准备密文,去标点空格,全变大写
{
char ch;
int i=0;
int k=0;//忘记这个 k,用 i 弄错了好多次
FILE *fp=fopen("a.txt","r");//打开文件
if(!fp)
{
printf("can't open file\n");
return -1;
}
ch= fgetc(fp); 
while(!feof(fp))
{
if((ch>='a'&&ch<='z')){
aticle[k]=ch-32;
k++;
}
else if((ch>='A'&&ch<='Z')){
aticle[k]=ch;
k++;
}
i++;
ch= fgetc(fp); 
}
aticle[k]='\0';
printf("这段密文有%d 个字母\n",k);
printf("%s",aticle);
printf("\n");
fclose(fp);
return 0;
}
//创建密文
int creatcipher()//创建密文,去标点空格
{
char ch;
int i=0;
FILE *fp=fopen("cipher.txt","w");
if(!fp)
{
printf("can't open file\n");
return -1;
}
fprintf(fp,aticle); 
fclose(fp);
return 0;
}
//读获取的密文
int readcipher()//读获取的密文
{
char ch;
int i=0;
FILE *fp=fopen("gotcipher.txt","r");//打开文件
if(!fp)
{
printf("can't open file\n");
return -1;
}
ch= fgetc(fp); 
while(!feof(fp))
{
cipher[i]=ch;
i++;
ch= fgetc(fp); 
}
cipher[i]='\0';
printf("需要破译的密文为\n\n");
printf("%s\n",cipher);
printf("\n");
printf("这段密文有%d 个字母\n\n",i);
fclose(fp);
return 0;
}
//各个字母在密文中出现的频率
int letterfrequency(){
char ch;
int i;
int j;
int k;
int sum=0;
int charactertimes[30];
int characternum=0;
for(j=0;j<26;j++)
charactertimes[j]=0;
//字母计算频数概率
for(i=0;cipher[i]!='\0';i++){
ch=cipher[i];
characternum++;
if((ch>='A'&&ch<='Z')){
charactertimes[ch-65]++;}
}
printf("密文中总共有字母%d 个\n\n",characternum);
//之前这里 25 数组越界
for(j=0;j<26;j++){
printf("密文中字母%c 出现的次数%d\n",j+65,charactertimes[j]);
sum=sum+charactertimes[j];
}
printf("\n\n\n");
printf("这些字母出现的次数之和为%d\n\n",sum);
printf("这些字母分别出现的概率为\n\n");
for(j=0;j<26;j++){
printf("密文中字母%c 出现的概率为%6.2f%%\n",j+65,100*(charactertimes[j])/(float)sum);
}
return 0;
}
//找到密文中出现频率高的字母对应的频率高的结构结构
int findwordsstructure()
{
char wordstructureR[300][10];
char sortwordstructureR[300][10];
char sortwordstructureNum[300];
char replaceword[10];
int i=0;
int j=0;
int k=0;
int structurenum=0;
int changeline=0;
int before3;
int before2;
int before1;
int behind3;
int behind2;
int behind1;
char ch;
int characternum=0;
for(i=0;cipher[i]!='\0';i++){
ch=cipher[i];
characternum++;
}
int state=0;
//printf("%d\n",characternum);
//printf("%s\n",cipher);
printf("密文中形如**R 的结构有\n\n");
for(i=5;i<characternum-5;i++){
ch=cipher[i];
//这里本来应该是等于的写成了赋值
if(ch=='R'){
changeline++;
before3=i-3;
before2=i-2;
before1=i-1;
behind3=i+3;
behind2=i+2;
behind1=i+1;
printf(" %c%c%c ",cipher[before2],cipher[before1],cipher[i]);
replaceword[0]=cipher[i-2];
replaceword[1]=cipher[i-1];
replaceword[2]=cipher[i];
replaceword[3]='\0';
//printf("0000%s\n",replaceword);
//**R 型的单词全部存进了 wordstructureR
strcpy(wordstructureR[structurenum],replaceword);
structurenum++;
if(changeline%5==0)
printf("\n");
}
}
/*for(i=0;i<structurenum;i++)
printf("wordstructureR %s \n",wordstructureR[i]);*/
printf("\n\n");
//按字母顺序输出 wordstructureR 中的单词
//printf("按字母排序后的单词单词\n");
//sortwordstructureR 里面储存了排序后的单词
printf("按字母顺序输出的**R 的结构的结构\n");
k=0;
for(i='A';i>='A'&&i<='Z';i++){
for(j=0;j<structurenum;j++){
if((wordstructureR[j][0]==i)){
state=1;
printf("%s ",wordstructureR[j]);
strcpy(sortwordstructureR[k++],wordstructureR[j]);}
}
if(state==1){
puts("\n");
state=0;
}
}
printf("密文中总共有%d 个**R 结构的单词\n\n",structurenum);
/*for(i=0;i<structurenum;i++)
printf("sortwordstructureR %s \n",sortwordstructureR[i]);*/
//用 sortwordstructureNum 记录每个**R 单词出现的次数,下标相对应,重复的记在第一次出现
的位置
for(i=0;i<structurenum;i++){//初始化
sortwordstructureNum[i]=0;
}
//后面的每一个和前面做比较,发现相同,前面加 1,发现不同,自己加 1
//state 为 0 表示没加,等于 1 表示加了
state=0;
sortwordstructureNum[0]=1;
for(i=1;i<structurenum;i++){
for(j=0;j<i;j++){
if(strcmp(sortwordstructureR[i],sortwordstructureR[j])==0){
sortwordstructureNum[j]++;
state=1;
break;
}
else
state=0;
}
if(state==0){
sortwordstructureNum[i]++;
state=1;
}
}
for(i=0;i<structurenum;i++){
if(sortwordstructureNum[i]!=0)
printf(" 第 %3d 号 位 置 的 结 构 %s 出 现 了 %3d 次 
\n",i,sortwordstructureR[i],sortwordstructureNum[i]);
}
//出现频率比较高的单词结构
printf("\n 出现频率比较高的**R 结构\n\n");
for(i=0;i<structurenum;i++){
if((sortwordstructureNum[i]!=0)&&(sortwordstructureNum[i]>=4))
printf(" 第 %3d 号 位 置 的 结 构 %s 出 现 了 %3d 次 
\n",i,sortwordstructureR[i],sortwordstructureNum[i]);
}
return 0;
}
//和随便网上找的文章做对比
int RandomArticleStructure()
{
char ch;
int i=0;
int k=0;//忘记这个 k,用 i 弄错了好多次
FILE *fp=fopen("randomarticle.txt","r");//打开文件
if(!fp)
{
printf("can't open file\n");
return -1;
}
ch= fgetc(fp); 
while(!feof(fp))
{
if((ch>='a'&&ch<='z')){
randomarticle[k]=ch-32;
k++;
}
else if((ch>='A'&&ch<='Z')){
randomarticle[k]=ch;
k++;
}
i++;
ch= fgetc(fp); 
}
randomarticle[k]='\0';
printf("这段随意找的文章有%d 个字母\n",k);
printf("%s",randomarticle);
printf("\n");
fclose(fp);
return 0;
}
int RandomArticleletterfrequency(){
char ch;
int i;
int j;
int k;
int sum=0;
int charactertimes[30];
int characternum=0;
for(j=0;j<26;j++)
charactertimes[j]=0;
//字母计算频数概率
for(i=0;randomarticle[i]!='\0';i++){
ch=randomarticle[i];
characternum++;
if((ch>='A'&&ch<='Z')){
charactertimes[ch-65]++;}
}
printf("这段随意找的文章中总共有字母%d 个\n",characternum);
//之前这里 25 数组越界
for(j=0;j<26;j++){
printf("这段随意找的文章中字母%c 出现的次数%d\n",j+65,charactertimes[j]);
sum=sum+charactertimes[j];
}
printf("这些字母出现的次数之和为%d\n",sum);
for(j=0;j<26;j++){
printf(" 这段随意找的文章中字母 %c 出现的概率
为%6.2f%%\n",j+65,100*(charactertimes[j])/(float)sum);
}
return 0;
}
int Useletterfrequency(char somewords[]){
char ch;
int i=0;
int j;
int k;
int sum=0;
int charactertimes[30];
int characternum=0;
FILE *fp=fopen("frequency.txt","w");
if(!fp)
{
printf("can't open file\n");
return -1;
}
for(j=0;j<26;j++)
charactertimes[j]=0;
//字母计算频数概率
for(i=0;somewords[i]!='\0';i++){
ch=somewords[i];
characternum++;
;
全部论文及程序请见下方“ 只会建模 QQ名片” 点击QQ名片即可

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/499265.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Nodejs 16与 gitbook搭建属于你自己的书本网站-第一篇

最近想重新搭建一个网站来存放自己的相关知识点&#xff0c;并向网络公开&#xff0c;有个hexo博客其实也不错的&#xff0c;但是总感觉hexo很多花里胡哨的玩意&#xff0c;导致挂载的博客异常卡&#xff0c;这样反而不利于我自己回顾博客了&#xff0c;于是我就开始钻研这个鬼…

Android逆向-数据修改逻辑修改视图修改

目录 0x00 相关工具及环境 0x01 APP逆向 - 数据修改 0x02 APP逆向 - 逻辑修改 0x03 APP逆向 - 视图修改 希望和各位大佬一起学习&#xff0c;如果文章内容有错请多多指正&#xff0c;谢谢&#xff01; 个人博客链接&#xff1a;CH4SER的个人BLOG – Welcome To Ch4sers B…

Git Fork后的仓库内容和原仓库保持一致

Git Fork后的仓库内容和原仓库保持一致 ①Fork原仓库内容到自己仓库 ②将项目内容下载到本地 ③使用git命令获取原仓库内容&#xff0c;将原仓库的最新内容合并到自己的分支上并推送 下面从第三步开始演示~ 这里以码云上的若依项目为演示项目 ③使用git命令获取原仓库内容 …

什么裤型的裤子最百搭?男生比较好看的裤子品牌分享

很多男生每隔一段都会选择一些新的裤子&#xff0c;但是现在市面上的裤子种类和风格太多&#xff0c;并且有不少材质劣质、细节设计差的品牌混杂在其中&#xff0c;大家一不小心就选到质量不好的裤子。 所以如何选择到合适、质量好的裤子确实是一个让人头疼的问题&#xff0c;…

AcWing 4609:火柴棍数字 ← 贪心算法

【题目来源】 https://www.acwing.com/problem/content/4612/【题目描述】 给定 n 个火柴棍&#xff0c;你可以用它们摆出数字 0∼9。 摆出每个数字所需要的具体火柴棍数量如下图所示&#xff1a; 请你用这些火柴棍摆成若干个数字&#xff0c;并把这些数字排成一排组成一个整数…

Netty学习——源码篇5 EventLoop 备份

1 Reactor线程模型 Reactor线程模型 中对Reactor的三种线程模型——单线程模型、多线程模型、主从多线程模型做了介绍&#xff0c;这里具体分析Reactor在Netty中的应用。 1.1单线程模型 单线程模型处理流程如下图&#xff1a; 单线程模型&#xff0c;即Accept的处理和Handler…

(科研篇)如何做科研

1.科研周期&#xff1a; 2.CCF列表 1.搜索论文&#xff08;顶会&#xff09; 2.谷歌学术检索 3.如何阅读文献 最重要的部分是abstract introduction 和related work&#xff0c;要明白某个东西的历史&#xff0c;从而进一步发现的缺陷&#xff0c;然后通过实现实验去证明。 通…

HubSpot出海CRM的团队协作与流程优化

在数字化营销日益盛行的今天&#xff0c;团队协作与流程优化已成为企业获取竞争优势的关键因素。HubSpot出海CRM不仅提供了强大的客户管理工具&#xff0c;更在团队协作与流程优化方面展现出卓越的能力。 一、团队协作在营销中的重要性 团队协作在营销中的重要性不言而喻。一…

光伏智慧管理平台:全周期全流程光伏业务管理

随着光伏技术的快速发展和光伏电站规模的不断扩大&#xff0c;光伏业务的管理变得越来越复杂。为了提高管理效率、降低运营成本并提升光伏电站的运行效益&#xff0c;光伏智慧管理平台应运而生。本文将重点介绍光伏智慧管理平台的功能及其在全周期全流程光伏业务管理中的应用。…

最长有效括号(C语言)

题目链接&#xff1a;. - 力扣&#xff08;LeetCode&#xff09; 这道题&#xff0c;我看了一种解法&#xff0c;觉得很好&#xff0c;来分享一下 这道题主要是 思考 当前 ) 与之匹配 ( 在哪里 &#xff0c;记录下来&#xff0c;最后比较最大值 例子&#xff1a; 第…

浅谈 kafka

引言 同事在公司内部分享了关于 kafka 技术一些相关的内容&#xff0c;所以有了这篇文章&#xff1b;部分图片选自网络摘抄&#xff1b; 1 Kafka概述 1.1 定义 Kafka传统定义&#xff1a;kafka是一个分布式的基于发布/订阅模式的消息队列。 Kafka最新定义&#xff1a;kafka…

【Frida】【Android】05_Objection实战

&#x1f6eb; 系列文章导航 【Frida】【Android】01_手把手教你环境搭建 https://blog.csdn.net/kinghzking/article/details/136986950【Frida】【Android】02_JAVA层HOOK https://blog.csdn.net/kinghzking/article/details/137008446【Frida】【Android】03_RPC https://bl…

Kibana操作Elasticsearch教程

文章目录 简介ES文档操作创建索引查看索引创建映射字段查看映射关系字段属性详解typeindexstore 字段映射设置流程 新增数据新增会随机生成id新增自定义id智能判断 修改数据删除数据查询基本查询查询所有&#xff08;match_all&#xff09;匹配查询多字段查询词条匹配多词条精确…

HarmonyOS 应用开发之创建PageAbility

开发者需要重写app.js/app.ets中的生命周期回调函数&#xff0c;开发者通过DevEco Studio开发平台创建PageAbility时&#xff0c;DevEco Studio会在app.js/app.ets中默认生成onCreate()和onDestroy()方法&#xff0c;其他方法需要开发者自行实现。接口说明参见前述章节&#xf…

maven 依赖机制

安全工程师为啥关注maven依赖 log 4j事件之后&#xff0c;大家开始更加关注开源组件安全漏洞这个事。纷纷引入SCA 软件成分分析工具来识别项目中存在的开源组件和漏洞。 在sca工具扫描之后&#xff0c;会报出一大堆组件&#xff0c;review这个事就是安全团队投入时间来研判了…

【Linux多线程】线程的同步与互斥

【Linux多线程】线程的同步与互斥 目录 【Linux多线程】线程的同步与互斥分离线程Linux线程互斥进程线程间的互斥相关背景概念问题产生的原因&#xff1a; 互斥量mutex互斥量的接口互斥量实现原理探究对锁进行封装(C11lockguard锁) 可重入VS线程安全概念常见的线程不安全的情况…

是谁?阻止CXL在AI场景大展身手~

CXL虽然被视为业内新宠&#xff0c;但好像在AI场景的应用反而没有得到广泛的响应。 AI场景对内存带宽、容量以及数据一致性有着极高需求&#xff0c;特别是在深度学习训练和推理过程中&#xff0c;大量数据需要在CPU、GPU、加速器以及内存之间快速、高效地流动。CXL作为一种新…

Java基础入门day24

day24 abstract 抽象&#xff1a;似是而非&#xff0c;像又不是&#xff0c;具备某种对象的特征&#xff0c;但不完整 生活中的抽象&#xff1a;动物&#xff0c;并不真实存在的事物 程序中的抽象&#xff1a;不应该被创建的对象&#xff0c;动物近视一种会吃会睡的对象&#…

Netty核心原理剖析与RPC实践16-20

Netty核心原理剖析与RPC实践16-20 16 IO 加速&#xff1a;与众不同的 Netty 零拷贝技术 今天的课程我们继续讨论 Netty 实现高性能的另一个高阶特性——零拷贝。零拷贝是一个耳熟能详的词语&#xff0c;在 Linux、Kafka、RocketMQ 等知名的产品中都有使用&#xff0c;通常用于…

【单调栈】力扣84.柱状图中最大的矩形

上篇文章我们介绍了使用 无重复值 单调栈代码解决 含有重复值 的问题&#xff0c;在文章的最后&#xff0c;留下了一道考察相同思想的题目&#xff0c;今天我们来看看如何套路解决该题。 &#xff08;还没看过前几篇介绍的小伙伴赶快关注&#xff0c;在 「单调栈」 集合里查看…
最新文章