随着技术的进步,搜索引擎其实应用门槛约实际上越来越低,你随意输入的关键词,百度Google这样的搜索引擎都能通过算法和技术模型,快速给你返回你想要找的信息相关的或者看起来“貌似”相关的信息。与此同时的另一端,就是搜索出来的内容,这个生态也在不断演进,内容生产的一些产品和技术手段的进步,带来内容生产的门槛的降低、成本的降低、传播模式的进化等,导致搜索引擎找到所需变得更更困难了。2000年的时候,百度能收录中文500万网页,都已经好厉害了,但是今天,这个数字已经翻了2000倍,随便搜索一个词,都给你几百万条结果。除了难辨真假外,---这,搜索结果太多,不够准确,在搜索结果中的二次筛选,又成了新的搜索技术应用门槛。搜索引擎在面对信息量级的集合级规模增长的时候,还有各种针对搜索和传播的直接cheat,用户通过搜索获取的成本越来越高,甚至夸张点说,信息量巨大,超越搜索引擎的驾驭能力的时候,已经造成了新的信息不对称。社交信息的封闭、invisible web的疯狂增长,让用户在平等获取信息的能力层面,迎来了新的挑战。那如何当前场景下,有效利用好搜索和互联网信息工具,获取信息和使用信息,与若干年前相比的思考和实践相比,我最近做了一些新的归纳和总结,并提出了一些新的问题的开发和解法。如果您也有一些自己的方法和经验,欢迎跟哈斯交流探讨。1 你要清楚自己要找的信息可能会在哪里存在首先你要知道你要什么,这是搜索引擎获取信息的基本前提,清晰的目标认知是基础清楚要什么之后,想想你需要的信息会在哪里,网页里、微博等社交网站里、还是网络存储里,是文档形式、还是音视频文件格式里?不同存在形态,决定了你用什么方式逼近他,用什么工具来获取和消费他。另一种情况,就是他会在墙内还是墙外。会不会被阉割掉,他会以什么特征存在。还有就是他可能不会存在于网络上,如果是传统的存在形式、或者特殊存在态,到底接近真相的最短路径是什么。2 评估其可能的存在形式一般情况这个这句话,有这么三层含义,其一是这个内容会是一个什么类型的信息存在,网页、音视频、数据库的一条资源、一条微博、亦或是一段微信朋友圈的私密信息?其二,是一个文档还是一个应用程序安装包,其三,可能会存在于什么类型的网站上,从事理关系上理解其存在的客观性和可信度的评价【输入“虚假信息”可获取关于哈斯日志此前发布的利用搜索引擎获取信息的信息真伪判断的一些思考】。有了这些基础判断,你可以在使用什么搜索工具的选择上,以及是否需要配套支持的工具等方面做足准备。甚至有时候,前置去先搜索和找到相应的工具。3 搜索工具的选择。在考虑使用什么搜索工具最好时,除了百度Google之外,各种垂直工具其实也很多,比如视频搜索、微博搜索、产品比价搜索、学术论文搜索、电子书等这些垂直工具或者专业搜索引擎,可能在有些特征的内容的搜索上,会帮到你更多。当然,有些时候,可能通用搜索工具百度Google这类工具,只是找到你找信息的一条线索,比如找到特征词、找到相关领域的垂直工具等,比如追踪学术成果类,可能就是用特征关键词+发表等找到具体学术成果的标准描述,然后再学术搜索引擎如cnki、万方等网站进行准确搜索。一般通用搜索工具百度Google里对时效性高、事件速度趋近实时的,这类信息反应都不如twitter、微博里搜索反馈更快。4 找到恰当关键词来表达你的需求。毕竟搜索引擎还没有智能到象阿拉丁神灯一样,你说要啥,他马上就能找出拉给你。搜索结果反馈的只能是互联网世界的一种相对客观的存在。这种存在又是一种生态级的复杂现实的映射,网络上不存在的信息或者不存在的资源,你确实无法通过搜索来获得。网络上存在的,又不是一般性开发Web形式,则需要一些技巧和绕弯。更有很多的时候,你需要查找的信息,是用多重查询的结果中的相关线索,相互验证、互相补充、再加上你的智慧进行黏合获得。虽然搜索结果在很多集成应用上做了优化,比如可以直接处理计算器、汇率转换计算、度量衡、天气预报、车号限行等,相对于各自垂直领域的处理能力,搜索引擎这个处理水平只能说很初级,可以在适当时候使用,别抱有太高期望。5 关键表达的技巧:(1)准确,精悍。多个词组并列表达,以空格分割,不要描述性语言。精确提炼要搜索消息的关键词,配置相关类型的pattern term,比如搜索资讯类,就可以配置发布、报道之类的pattern term。比如你搜索“06版本的越狱工具”与“ios 06 越狱”中间都有空格哦,这两者结果是完全不同,前者的结果基本没用【限于2月24日21:05分搜索测试效果哦】。(2)一般能准确提炼要搜索的信息的核心词表达即可,别加过多的辅助词汇,尤其是明显冗余的词汇,比如腾讯QQ微博。如果非要加的话,可以用|来做分割,表达“或”搜索的关系。当然现在一般都已经引入了统计模型,会对你的搜索关键词进行纠正,甚至会对你的关键词中非准确表达的信息进行自动修正或者忽略,我这里描述的仅限于搜索一些很稀有的内容是需要关注,大众化,遍地都是的那些资讯,这些方法没有太大价值。当然,也不要迷信智能搜索和精确匹配,找不到时换个词、切分一下长搜索关键词的表达方式。想想如果你来表述这段信息的时候,会怎么描述这段文字,别人会用什么样的语汇去描述,这样能帮助你更好的提炼关键词。(3)对于特别强调的关键词特征,要求必须匹配的加双引号,提示搜索引擎这个词不能忽略、不能切分成子term。比如,搜索“哈斯日志“ invisible web,与不加双引号的结果就不一样。(4)能有效利用搜索引擎高级语法,将大大提高搜索目标抵达的速度和获取信息的效率,比如site(限定网站内)、intitle(关键词出现在网页标题中)、inurl(关键词出现在网址中)、filetype(文档类型,泛指除了网页文本类型外的,如PDF、doc、rtf、excel、ppt)、逻辑符号(特意强调一下,排除某关键词用减号-),甚至Google支持通配符、百度filetype:all专有搜索所有文档类文件。一般高级语法与关键词中间需要一个空格,比如,site: mtk,就可以找到很多mtk芯片手机的工具、rom,当然,如果你知道是mtk什么型号,那结果将更精准。搜索引擎的高级搜索能提供更精确的搜索方法,比如相关网页、限制时间、inanchor--锚链接文本、intext--网页正文而不是其他位置等(5)搜索到结果后,有效地分辨目标网页信息资源存在的可能。一般情况下,大站比小站靠谱,个人博客、论坛社区比新闻媒体真实,官方网站gov、edu、ac类后缀网站上信息比其他网站信息权威。当然泛指,这些有个前提就是在墙内的生态状况下。很多作弊网页、搜索结果聚合页面都没有有效信息,从网站知名度、快照打打开网页利用Ctrl+f快速找一下你要找的关键词,看下周边信息是否是你需要的。还有个好处是,很多网站现在都存在钓鱼和挂马之嫌,快照因为不加载网页某些动态载入的代码,所以相对安全些。(6)快速获取别人的搜索经验和技巧比如搜索框下拉的suggestion提示,搜索结果下方的相关搜索,百度搜索结果右侧“搜索这个关键词的人还在搜”等,搜索引擎已经利用众包、大数据的力量替你做了一些推荐性的提示,也许这里能帮你找到抵达目标的其他线索。(7)发挥垂直搜索应用工具的功用对于某些更具体的应用,比如电话号码验证,看是不是骚扰电话、是哪里的,你已经可以直接在搜索框搜索,也可以利用一些垂直搜索工具如ip138、来电通、搜狗号码通这样的垂直工具(后两者,安装相应的APP,在手机上拨一下号码即可查获)另外垂直工具随着互联网业态的丰富也已经都有有了很多,购物、旅游、酒店、机票、文档、模板搜索,电脑软件、手机软件下载搜索,音乐搜索,购物搜索,学术论文、文献检索工具、找人、地图搜索、以图搜图等。著名的个人网站汉典做词典查询做的无比专业,当年在费了很大功夫联系到站长,把这份数据引入百度提供服务。(8)利用微博、twitter等社交网络的搜索,找线索很多信息时效性比较强,通用网页搜索找可能不及时,微博twitter这样的平台解决了这个问题,而且我们经常遇到信息被删除,所以利用这类工具找到相应的线索进行扩展,有效地规避屏蔽的内容。(9)找到信息以后,浏览和消费记得作笔记,摘要,重要内容留存备份。现在这类工具很多,存网页的、存内容copy的,都很容易使用,比如evernote【输入evernote可以看看哈斯日志一年前写的相关文章】。最早我使用信息备份的方法是邮箱、再到后来有furl、百度搜藏这类工具,到现在使用evernote,好记性不如烂笔头,这类工具帮你留存线索,以后再用再查找,都会方便很多。绝大多数情况下,我们都可以使用百度Google这样的搜索引擎工具找到自己需要的一般参考信息,但是对于有些实时传播的信息和话题,通过搜索引擎很难如此及时获取,所以在微博上搜索一下,是可以获知部分相关信息和关联的人物、线索的,然后在充分施展利用搜索引擎探索世界的快感。6 在移动互联时代,搜索将大不相同。在移动互联终端上,有充分利用移动终端特性的一些搜索工具和技巧,比如即拍即搜、比如扫码、比如定位查找附近等,甚至还有在移动设备OS内置的搜索的特性,有效管理自己本地的短信、通讯录、文件等内容。那么在移动设备上,垂直APP的选择就是你重要的信息获取通道,专业垂直类APP要配置到位,地图、音乐、吃饭、购物等等,其实都在不同角度去阐释某一个领域信息获取的需求,与传统一个搜索框不同的是,他们目前是多个地方多个输入框,所以又回到本文之初,你要知道自己需要什么,基于此才能开启你的工具选择和信息消费的旅程。移动设备上,获取信息的形态已经被各种APP推送技术颠覆了,绝大多数情况,我们不用在搜啊搜啊找信息,而是充分利用各种垂直的领域的优秀的APP来去探索和感知这个世界。但是,PC互联网上,搜索的技巧在移动上,用搜索引擎获取信息上依然使用,当然,移动时代这个需求显然被降低了。【输入搜索创新,可获取相关思考的分享】7 根据自己需求,利用网络工具定制自己的信息小助手当然,首先你得知道自己需要什么信息,然后利用工具帮你找到自己关注的、重要的信息,提醒你、推送给你。(1)利用监控关键词给你,把搜索结果变化推送给你,提醒你关注,Google alert。(2)知道你关注那些网站或者网页的,利用feed或者生成feed的工具,推送给你,yahoo pipe、feedspot、feedburner、feedsky等支持订阅转邮件提醒,(3)利用网页定向监控工具跟踪更新和演进,比如,follow the page,提醒新然后你选择去看。这个服务,仅限于本身更新品读较低,但是内容是你特别关注的。比如,我就用这个工具订阅了食品药品监督局网站上公布的食品药品抽检和不合格产品公示信息。有效掌握信息,掌握使用信息的工具和方法,对我们个人实实在在受益。9238的签名“我们若能更妥善地搜寻资料,实在已经改变世界”【输入“俞军”获取相关信息推送】。保持对信息的敏感、掌握适当可用的方法,有效利用信息,又不被各种真真假假困扰、甚至误导,让信息技术成为个人成长、生活娱乐的好帮手,而不要被其奴役,成就愉快的网络之旅!