阿里巴巴搜索研发类笔试试题
试卷分三部分
1.java
2.搜索 C++(这2个为什么要混在一起?)
3.公共(都要做)
我做的是B卷、搜索研发类,只记得其中的一部分内容(都是关键字,实在记不全所有的内容了。。。。。)
B卷
基本上都是选择,只有最后公共题的最后两题不是。
1、DOM
2、utf-8编码字节大小?
3、网络蜘蛛
4、分布列(概率中的数学期望)
5、搜索查准率和查全率的一个计算题
6、索引压缩
7、cralwer速度的影响
8、信息熵量大小的影响
9、Trie算法的最差时间复杂度
10、HTML
11、HTTP协议
12、信息检索模型
13、分布式通信协议
14、分布式搜索引擎
15-25、C语言的一些知识,在面试宝典里面基本上都能找到原型
1、要对语句A>1 OR B <= 3 测试……(不记得了)100%覆盖,至少要多少测试用例
2、典型的针对系统漏洞的Dos攻击?
3、4,2,2,3,6,15,( ?) A,20 B,24 C,25 D,45
4、3升,5升,7升量筒,已知3、5量筒装满水,7量筒为空,问至少要倒多少次才能使其中一个量筒的水为4升
5、太长了
6、太长了
7、保护邮件安全的软件?
8、普通用户执行超级用户文件的指令
9、软件测试对象
10、软件缺陷生命期
11、OPENAPI平台
12、超长字符串攻击属于?
13、项目的最重要的是()和()
14、可能引起Cross Site Scripting攻击的是?
15、马可夫模型(HMM)的三个基础?(非选择)
16、有序集合a, b,求交集(非选择)
HMM需要解决三个基本问题:
*1 评估问题:
给定观测序列 O=O1O2O3…Ot和模型参数λ=(A,B,π),怎样有效计算某一观测序列的概率.
*2 解码问题
给定观测序列 O=O1O2O3…Ot和模型参数λ=(A,B,π),怎样寻找某种意义上最优的观测序列.
*3 学习问题
怎样调整模型参数λ=(A,B,π),使其最大?
基本算法
针对以上三个问题,人们提出了相应的算法
*1 评估问题: 向前向后算法
*2 解码问题: Viterbi算法
*3 学习问题: Baum-Welch算法