转自:编程技术宇宙前几天在百度搜索的时候,一不小心误点搜索候选词,给我跑到搜狗搜索里面去了,索性花了点时间分析一下这其中的猫腻,不看不知道,一看吓一跳。在浏览器中打开百度,使用搜狗输入法输入关键词时将 ...
![]() 转自:编程技术宇宙 前几天在百度搜索的时候,一不小心误点搜索候选词,给我跑到搜狗搜索里面去了,索性花了点时间分析一下这其中的猫腻,不看不知道,一看吓一跳。在浏览器中打开百度,使用搜狗输入法输入关键词时将出现搜索候选词列表: ![]() ![]() 测试实验测试1:360搜索输入框并没有这个候选词列表,如下图:![]() 结论1:搜狗输入法应该是对当前打开的页面有判断,不是随便哪个网页下面的输入框都会出现这个列表测试2:在百度页面,除了主要的搜索框以外,其他入口也会出现这个搜索选项列表,下面是站点内搜索输入框的测试: ![]() 结论2:搜狗输入法没有判断当前输入框目标是不是搜索框测试3:这一次不用域名,换用IP地址来访问百度搜索。我的环境下ping www.baidu.com 解析的IP地址为:220.181.38.149,结果搜狗输入法竟然没有出现这个搜索选项列表: ![]() 结论3:这个搜索选项列表的出现跟网页当前的URL有关测试4:这一次来把浏览器的进程名字改一下,我这里选择火狐浏览器,将firefox.exe改为firefox1.exe,这个搜索选项列表也没有出现: ![]() 结论4:除了URL,对进程名字也有判断,如果不是浏览器进程,也不会触发最终结论:搜狗输入法检测到用户打开浏览器访问www.baidu.com域名进行搜索时,将弹出搜索选项列表,引导用户点击。 技术分析如何实现浏览器进程筛选?第一个问题,搜狗输入法怎么判断当前是不是在浏览器进程中呢?总不能在微信聊天界面也给弹出搜索候选词列表吧?搜狗输入法核心模块是一个叫SogouPY.ime的文件,这实际上是一个动态链接库文件,这个文件会随你切换输入法时加载到对应的进程中。使用IDA打开分析,发现这个模块内部有很多浏览器进程名字的字符串:![]() ![]() 当前页面的URL获取及判断浏览器进程筛选出来了,还要筛选当前是不是在搜索引擎的页面,接着往下看!针对不同浏览器使用不同的获取方式,这里以firefox为例,搜狗输入法使用了MSAA(Microsoft Active Accessibility)技术获取到了当前页面URL。调试发现,如果修改获取到的URL内容,搜狗输入法的搜索选项列表就无法展示出来。向上追溯可以找到根据不同浏览器进行不同的URL获取方式分发入口:![]() 继续追溯,获取当前浏览器信息后,还要进行是否是搜索引擎域名的判断: ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() 如何打开搜狗搜索页面呢?当发现是在浏览器进程中访问上面的搜索引擎域名后,就该跳转到搜狗自己的搜索页面了,那它是如何打开的呢?继续往下看!打开firefox,使用调试器WinDbg 挂载到这个进程,执行这个命令:bp shell32!ShellExecuteW,给函数ShellExecuteW下断点。接着打开百度首页,切换到搜狗中文输入法,这样使得SoGouPY.ime模块加载到firefox的进程空间中。然后随意输入字符,出现搜狗搜索选项列表,随便点击一个,触发断点!来看一下参数:![]() ![]() 总结和实验得到的结论一致。一图胜千言,整个过程就是这个样子的:![]() 多说几句事实上,搜狗干这事已经有好些年了。几年前,百度还把搜狗给告了,搜狗败诉赔钱。不过,输了是输了,就是坚决不改![]() ![]() 对于搜狗输入法的这骚操作,你怎么看? 本文来自网络,如若转载引用本网站内容须注明原网址,并标明本网站网址(www.anwei66.com)。 对于不当转载或引用本网站内容而引起的民事纷争、行政处理或其他损失,本网站不承担责任。 |
0