Archive for the ‘科技’ Category
PhET: Interactive Simulations
推荐一个在线物理、化学现象交互演示的网站PhET: http://phet.colorado.edu/ ,也可能我火星了。
淘宝修改了排序算法
原来如果对搜索出来商品按价格从低到高排序的话,系统就是按价格从低到高排序。现在系统将正品与配件分开按价格高低排序,并把正品放在前面。比如搜索nokia n810,搜索结果中有机子本身,也有电池、膜等等这些配件。如果选择按价格从低到高排序的话,就会先显示机子从低到高的结果,再显示配件从低到高的结果。
不清楚算法的细节,不知道有没有误判。如果考虑了品名,误判会少些,如果只是按价格的跳跃进行判断,误判会多些,特别是新机与二手机同时存在的时候。
另外,搜索算法好象有点问题。按道理讲,“nokia n810”的所有搜索结果,应该都包括在“n810”的搜索结果中,但事实上不是这样。搜索“n810”出来的结果主要是夏新的手机,不包括很多“nokia n810”搜出来的商品。有点奇怪。
==================================
7月17日:排序结果有点乱,莫名其妙。
Google Chrome OS
无风不起浪,传说原来都是真的。
SCI收录数学类期刊2007年影响因子(Excel版)
有领导要这个,就整理了一下,有需要的请自行下载,下载完了吼一声。
下载:SCI收录数学类期刊2007年影响因子(Excel)
影响因子数据来源:http://admin-apps.isiknowledge.com/JCR/JCR
期刊分类依据:http://www.isinet.com/cgi-bin/jrnlst/jlsubcatg.cgi?PC=K
附全部期刊的影响因子:JCR 2007
论高等教育——2008年6月2日丘成桐于北京
现在的Page Rank是否已经考虑RSS订阅的权重
Google Reader的用户已经足够多,不太清楚现在的Page Rank算法是否已经考虑了RSS订阅的权重。订阅一个网站显然是对该网站已有内容的一种肯定,对未来将要出现的内容的一种期待,应该比友情链接更为重要。同样的,Google Bookmarks,Notebook里面的内容,也是相对比较重要的内容。还有就是,Reader里的,Bookmarks里的,Notebook里的都是经过人工筛选的内容,并且进行了手工聚类。我现在有点明白Google为什么提供这些产品了。
转载:英特尔伯克莱研究所展示使用手机构筑的传感器网络
原文在:http://hi.baidu.com/vvfang/blog/item/af89ef1f73ecab67f724e4de.html
注:这个想法不错。能不能利用每个人正在使用的手机构建这样的网络?这样的好处是密集、实时。但是有可能引发隐私方面的争议。或者可以在销售的时候,说明有这样的功能,让消费者自己选择。
英特尔伯克莱研究所展示使用手机构筑的传感器网络
http://china.nikkeibp.co.jp/china/news/mobi/mobi200803120119.html
【日经BP社报道】
美国英特尔的伯克莱研究所(Intel Reseach Berkeley)2008年3月6日举行了名为“2008 Open House at
the Intel Research
Berkeley”的研究成果展示会。公布了与美国加州大学伯克莱分校合作研究的内容,展示了Web网站搜索功能、编程语言、网络、网络安全、传感器网络
的相关研究成果。
其中,最让人感兴趣的是使用淘汰手机构筑的传感器网络。该研究所表示,除了将淘汰手机作为通信基础设施用于传输传感器测量的数据之外,通过有效使用相机手机来发送现场图像和影像。
据称美国每年有1亿5000万部手机被淘汰,其中仅有不到1%被回收。使用淘汰手机,不仅可以低成本构筑传感器网络,还可以提高手机的循环利
用率,达到环保目的。该研究所表示,此次展示的目的并不是为了追求技术水平,而是为了提出一个方案,就是形成一个便于了解周边事物的交流社区(图1)。
另外,该研究所还展示了传感器网络的应用实例,就是使用传感器网络对大气中汽车尾气浓度的分布进行实时检测。传感器网络以检测PM(粒子状物质)的MEMS传感器为主,包括一氧化碳传感器、温度传感器以及手机(图2)。MEMS传感器由美国加州大学伯克莱分校开发。
传感器的数据通过蓝牙无线通信装置发送给手机,再由手机发送给信息处理中心。由于无需使用专用数据传输装置,与原来的系统相比,数据收集的成本更低。(记者:狩集 浩志)
百万美元大奖:Netflix Prize!
DVD在线租赁商 Netflix 于 2006 年 10 月 2 日发起一项竞赛:Netflix Prize,任何组织或个人只要能够提交比它现有电影推荐系统 Cinematch 效果好 10% 的新方法,就可以获得一百万美元的奖金。竞赛最多持续到 2011 年 10 月 2 日。同时,Netflix Prize 还提供每年五万美元的年度进步奖。2007 年年度进步奖由来自 AT&T 的 BellKor 小组夺得。
竞赛提供四十八万多用户对一万七千多部电影的上亿条评分记录,要求参赛者根据这些信息推测另外近三百万条记录打了什么分数。Netflix 计算参赛者的推测与实际的打分结果的 RMSE(root mean square error),以此评定成绩。Cinematch 自己的 RMSE 是 0.9514。目前最好成绩是 0.8675,由”When Gravity and Dinosaurs Unite” 小组于 2008 年 3 月 1 日提交。BellKor 小组暂居第二,成绩是 0.8682(去年 BellKor 获奖的成绩是 0.8712)。
截止到 2008 年 3 月 7 日 20:55:57,竞赛已经吸引了来自 168 个国家的 27600 多支队伍参加,收到 23170 份有效的提交结果。成绩最好的 40 份结果进入排行榜。
Netflix Prize 竞赛应该说是双赢的活动。一方面,Netflix 以相对较少的成本,吸引了全球的研究者为其开发电影推荐算法,并获得了良好的宣传效应。另一方面,竞赛所提供的海量真实数据对于数据挖掘,知识发现,机器学习等方向的研究来说,是不可多得的珍贵数据。
PS:关于竞赛更多的信息,请自行在网上查找
三门问题
这个著名的问题是这样的:(引自中文wiki: http://www.mirrorin.com/wiki/emgud2lr/aXBlZGlh/Lm9yZy93/aWtpLyVF/NCVCOCU4/OSVFOSU5/NyVBOCVF/OSU5NyVB/RSVFOSVB/MiU_3D/98)
这个游戏的玩法是:参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门就可以赢得该汽车,而另外两扇门后面则各藏有一只山羊。当参赛者选定了一扇门,但未去开启它的时候,节目主持人会开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。问题是:换另一扇门会否增加参赛者赢得汽车的机会率?
很多人(包括我自己)第一次看到这个题目的时候直观的感觉剩下的两扇门后面要么是羊要么是汽车,换不换门选中汽车的概率都是1/2,换门并不能提高选中汽车的可能性,那还是坚持最初的选择好了。而事实并不是这样。问题的答案是:如果不换,那么选中汽车的概率是1/3,如果换,选中汽车的概率是2/3。
网上已经有很多关于求解过程的讨论,这里我只讲我的理解。首先明确一点,主持人知道汽车在哪扇门后面并且他肯定会打开一扇有羊的门。否则如果主持人打开的是一扇有汽车的门,游戏就玩不下去了。既然主持人肯定会打开有羊的门,那么是否选择换另外一扇门就可以在整个游戏之前确定,也就是说,参赛者有两种策略,一种是随便选择一扇门并且不换门,另一种是随便选择一扇门并且在主持人打开有羊的门之后换选另外一扇门。下面只要分别计算这两种策略选中汽车的概率就可以了。
显然第一种策略选中汽车的概率是1/3,选中羊的概率是2/3。
第二种策略下可以根据第一次的选择分为两种互斥的情况,根据加法原理将两种情况下选中汽车的概率相加,就是第二种策略选中汽车的概率。
- 第一次选择的门后面是汽车,这个事件的概率为1/3。因为剩下的另外一扇门后面肯定是羊,即,是汽车的概率为0,因此这种情况下,最终选中汽车的概率为1/3*0=0。
- 第一次选择的门后面是羊,这个事件的概率为2/3。因为剩下的另外一扇门后面肯定是汽车,即,是汽车的概率为1,因此这种情况下,最终选中汽车的概率为2/3*1=2/3。
所以第二种策略选中汽车的概率为0+2/3=2/3。简单的讲,当参赛者以2/3的概率选中一扇有羊的门之后,主持只能将有汽车的门留给参赛者,如果换门,就可以选中汽车。
为什么我们会有最初的1/2困惑,并且相当一部分人看了”正确”的解答仍然坚持这样认为?我想了差不多一整天,我觉得关键是主持人打开的那扇门。因为主持人知道汽车在哪里,所以当他打开一扇有羊的门之后,剩下两扇门就不再是均匀分布了。
Wiki上关于这个问题的解答如下:
有三种可能的情况,全部都有相等的可能性(1/3):
- 参赛者挑山羊一号,主持人挑山羊二号。转换将赢得汽车。
- 参赛者挑山羊二号,主持人挑山羊一号。转换将赢得汽车。
- 参赛者挑汽车,主持人挑两头山羊的任何一头。转换将失败。
在头两种情况,参赛者可以透过转换选择而赢得汽车。第三种情况是唯一一种参赛者透过保持原来选择而赢的情况。因为三种情况中有两种是透过转换选择而赢的,所以透过转换选择而赢的概率是2/3。
这个解答在我看来是相当的简洁明了,比我上面讲的更直接。之所以没有在开始引用这个解答,是因为有人有这样的疑问:
参赛者挑的时候,把山羊分为一号、二号,主持人挑的时候怎么不分一号、二号?肯定有问题嘛!
这是表达上的小问题导致的误解,主要是句号的位置不正确。调整成下面这个样子估计会好些:
- 参赛者挑山羊一号。主持人挑山羊二号,转换将赢得汽车。
- 参赛者挑山羊二号。主持人挑山羊一号,转换将赢得汽车。
- 参赛者挑汽车。主持人挑两头山羊的任何一头,转换将失败。
昨天晚上看《数字追凶》(Numb3rs),查理教授在课上讲了这个游戏。视频在这里:http://6.cn/watch/57604.html。
10分钟邮箱——学会保护自己

十分钟邮箱是一个提供免费邮箱的网站,特别之处在于,它提供的邮箱只有十分钟,没错,就象它的名字一样,只有十分钟。不需要填写麻烦的表格,不需要提供任何个人信息,甚至不需要费脑筋想用户名,只需要点击申请邮箱的链接,马上就会得到一个邮箱地址。在接下来的十分钟里,所有发往这个邮箱的邮件,都自动会显示在屏幕上。如果十分钟不够用,还希望继续使用,那就点”再给我10分钟!”。

只有十分钟的邮箱,又不是我喜欢的用户名,有什么用呢?
现在很多网站都要求用户注册后,才能使用相关的服务,比如论坛。注册的时候又要提交各种各样的个人信息,通常会要求用户提供至少一个电子邮箱地址。而且很多网站为了防止机器人注册,防止用户随便填一个地址,还使用了Email验证机制,发一个什么验证码,什么验证地址到用户提供的邮箱,要再点一下才行,等等。总之,一定要用户提供有效的个人信息才行。而一旦你提供了真实的邮箱地址,邮箱里的垃圾邮件就很有可能增加。虽然不是所有的网站都会出卖用户的个人资料,但古话说的好”防人之心不可无”。有了十分钟邮箱,你就可以方便的试用各个网站的服务,满意了,信得过,值得注册,那就再换成正式的邮箱好了。
提醒:对于相对重要的网络服务,建议不要使用这项服务,以免收不到重要邮件。
http://www.feedsky.com/challenge/art/140687/feedsky/618618/~/gtsp/zt1/06562/lnk.html
![]()