Friday, October 29, 2010

HPC China 2010参会小记

今天跑去国家会议中心参加了HPC China 2010(其实是去打酱油和蹭饭的…),简要的记录一下。

上午八点从青年公寓出发,谁知路上堵车,九点才到,还以为要错过李国杰院士8:30的报告了。幸好组委会将李国杰的报告和AMD主题演讲对调了

今天上午的议程如下:

08:30-09:00 大会报告6:李国杰 中国工程院院士,中科院计算所所长)
《HPC和云计算--兼谈加强计算机系统研究的必要性》
09:00-09:30 AMD公司主题演讲
09:30-09:55 大会报告7:Douglas Neal Ball(The Boeing Company)
《The Use of CFD in Aircraft Design-Past, Current and the Future》
09:55-10:25 大会报告8:孙家昶(中国科学院软件研究所首席研究员)
《千万亿次高性能计算的挑战与思考》
10:25-10:40 茶歇
10:40-11:10 联想公司主题演讲
11:10-11:30 Mellanox公司主题演讲 《Paving the Road to Exascale
——为实现百万万亿次计算铺平道路》刘通
11:30-11:55 大会报告9:Merle Giles(NCSA)《Overview of HPC at NCSA》
11:55-12:15 浪潮公司主题演讲
12:15-12:40 大会报告10:Robert Clay Singleterry Jr (NASA Langley Research Center)
《NASA High Performance Computing (HPC) Directions,Issues, and Concerns: A User's Perspective》
12:40-13:30 午餐

其实我今天来的主要目的是来听李国杰院士的报告(说来惭愧,在科大,他是我们的系主任,在计算所,他是我们的所长,但是他的报告我一个也没听过,虽然他是我在计算机领域最敬佩的一个人之一…),由于堵车,赶到那已经九点了,本来以为又要错过他的报告了,幸好,组委会将他的报告和AMD主题演讲进行调换。我们刚到的时候AMD的主题演讲正快结束了。

李院士的报告题目为:《HPC和云计算--兼谈加强计算机系统研究的必要性》,其实他这篇报告的重点是“兼谈”部分--计算机系统研究。他提到的几个观点令我很深刻,在此记录一下:

  • 关于云计算,他说,其实很早就出现过,只是08年出现了商务模式的转变并开始热炒,2009年达到顶峰,2010又走入冷静期,或曰成熟期。之前的云计算服务,主要有两个缺点,那就是只对大客户提供,导致个人和小企业无法使用,从而无法大规模推广。云计算的本质是,资源虚拟化加并行计算,真正使云计算得到大规模应用的是虚拟化技术的应用,导致能够提供一个屏蔽软硬件环境差异的,对用户统一的平台(这让我想到我这个博客的后台就是基于云计算平台GAE的,其平台就是基于python 或者 java虚拟技术的),从而达到大规模应用。
  • 谷歌其实不是做搜索的,其实是做并行计算的(更严格讲,是做计算机系统的)。他讲到当年李开复刚到google时去找过他,李开复说,google 表面是做搜索,实际上的核心技术是并行计算(包括海量数据中心以及海量数据处理),所以他需要计算所做结构的人才。
  • 之前的体系结构的研究,导致了出现了软硬件的划分,定点浮点的划分。桌面应用的普及,导致了针对桌面应用的指令集出现。当今的云计算,以及各种网络应用等并行技术的出现,必然会导致定义新的体系结构和指令集(这让我想到Sun 公司的Nigarra处理器,也许算是对网络应用的一种尝试)。云计算还有一个不能解决的问题就是,自然界的应用千差万别,无法用一种通用的结构来计算。
  • 现今,计算机系统的设计,“带宽墙”比“存储墙”,“功耗墙”更严重。为了解决(或者说缓解)这个问题,他提到了胡伟武老师今年在斯坦福举行的Hotchips所提到的XPU观点,同时也提到了3B上的DMA技术。李院士讲完后,之后依次有来自波音公司,联想公司,NCSA,NASA,软件所等的报告,但我或者由于英语差听不懂,或者不感兴趣,没有仔细听。其中联想的首席科学家祝明发之前在一个师兄答辩会上见过,今天是第二次见了,其主要讲了Extra Flops的超级计算机的构建。在这些人的演讲中,只是有一个观点印象比较深:
  • 来自软件所孙家昶院士的观点,那就是代数化工具并不能解决所有计算问题,有时利用物理原理(即所求解问题本身的物理规律)能够很快的解决(不过其实这观点我没有听懂)。

最后,附几张图:

    主会场:


    AMD 主题演讲:

    李国杰院士演讲:

    The Boeing Company 的Douglas Neal Ball的演讲:

    茶歇,几个老外在讨论什么:

    来自NCSA还是NASA的演讲:

    Nvidia展台:


    最后一张,压轴,ws的哥站在世界上最快的计算机(没有之一)-天河一号旁:

    更多图片请看:

Tuesday, October 26, 2010

香山行

昨天翘课去了趟香山,算是见识了举国闻名(貌似没有举世闻名,因为老外很少,不像长城)的香山红叶,结果有点失望,感觉也不过如此。不过,既然去了,传些照片mark一下。

山下的湖,名字忘了

P1000441

上山中,看到了红叶,有点兴奋,可惜不是枫叶

P1000463

红叶没怎么看到,看到一些红果,感觉不错,拍之

P1000488

终于看到了树上的红叶,可惜还不是枫叶

P1000539

历经千辛万苦,终于看到真正的红叶,枫叶!!!尽管没全红:

P1000605

全景一张,本来拍了几张全景,但发现由于失误,回来都无法合成,杯具

全景1

Saturday, October 23, 2010

由SB的天地图想到的

今天在reader上看到说有一个国家队-“天地图”上场了,忍不住试用了一下,试用完后,忍不住想骂一句SB。

延续了中国官方一贯传统,IE only,插件泛滥(CCAV的国家网络电视台也是如此,并且兼容性极差,我就没在我电脑上成功装过那IE的插件),一个先上两张sb图(还有其他sb之处,在此就不细述了,想了解的自己体验去):

其实,无论是从技术上来讲,要实现兼容其他浏览器并不是难事,但为什么他们不做呢。我不由想到前几天ICT的几个在银行的做开发的师兄的抱怨。

他们说,在那里,你会不会做事不重要,关键是你要会不会体察领导的意思,很多事,领导虽然叫你做,其实他是不希望你去做好,做好了你以后就惨了(具体原因没讲,莫非一次做好,以后会断了财路,要慢慢的,分阶段做,以便更好想国家要钱,纳税人要钱)。在如此环境下,人人都必须体会领导的心思(领导的心思,除了钱,啥也没有),哪还有心思认真做事,更何谈做出创新的东西。

说到这里,不由的想到cnbeta上关于天地图的评论:

这配色 这字体 这读入速度...绝了...换个说法叫改进空间很大啊 =_=

是啊,改进空间很大,也就是意味着继续吸纳税人的钱的空间很大!

至于为什么会造成这种情况,两个字,体制,具体不多说。

Micolog添加自定义模块

有时,我们的博客需要经常更新一些模块的内容,如广告栏,以及一些其他不同的人设置不一样的工具。为了方便管理,这些模块最好都要移到后台,这样就可以经常更改模块内容而不用更改博客源码重新上传。之前,我在colin-young的博客上看到了一篇如何后台管理侧边栏模块的文章,受此启发,我想也可以把任何位置的模块都实现后台管理,经过尝试发现可行,具体效果直接看本文的中间和下面,左边的广告条以及aboutme就行了。在此简述一下实现方法(和colin-young的方法几乎一样,只是将其推广了)。

  • 在“\micolog\model.py”搜索“blognotice=db.TextProperty(default='')”,在其后加入:
     YouModelName=db.TextProperty(default='') 



  • 在“\micolog\views\admin\setup.html”搜索“blog.blognotice”,在30行处关于设置blognotice的代码,仿照其语法,添加如下代码:
    <tr valign="top">
    <th scope="row">{% trans "YouModelName:"%}</th>
    <td><textarea id="YouModelName" style="width:95%" cols="45" rows="2" name="YouModelName">{{blog.YouModelName|escape}}</textarea>
    </td>
    </tr>



    继续搜索notice,大概170行有如下代码

    <input value="title,subtitle,...,default_link_format,blognotice" type="hidden" name="str_options" />

    在blognotice附近添加你的模块名


  • 在需要调用该模块的地方,如sidebar.html,single.html等模板文件中,加入调用代码:
    <div id="YouModelName" class="widget widget_YouModelName">
    <h3>YouModelName</h3>
    <ul>
    {{blog.YouModelName}}
    </ul>
    </div>



  • 上传部署,在后台即可以看到模块设置了,支持任何html标签(注意,不能够转义,默认的blognotice转义了,即上面那步为{{blog.YouModelName}}而不是{{blog.YouModelName|escape}})



Done & enjoy~

Friday, October 22, 2010

Google releases the in-page analytics

Today, when i check my google analytics account, I find a new funtion of analytics:in-page analytics.

Here given a preview of my blog‘s in page-anlytics:

image

In the official blog of google analytics, it is introduced as following:

When looking at Google Analytics reports, sometimes it’s difficult to visualize how visitors navigate on a given website page. To make this visualization easier, some users keep the website open in another browser tab so they can reference it while looking through reports. Others rely on the Site Overlay report in Google Analytics, which, admittedly, hasn’t worked as well it could.

In-Page Analytics. With In-PageAnalytics, you can see your Google Analytics data superimposed on your website as you browse.

You can find the full announcements at the google anlytics blog.

Thursday, October 21, 2010

Some opensource projects create by me

On this page, i will place some open source projects created by me~

And all source codes  are licensed by GPL3.0.

Projects created by when i am an undergradute student of USTC:

  • An PWM generater ip core:this is a ip core writen in verilog lauguage aimed at generating pwm wave at real time.You can download the source code of the project in the following address:
  • An 8088 IP core writen in verilog, this is a opensource ip core create by HaoxiangLi and me,the ip core has implemented 40+ 8088 instructions.You can view the project home in Google Code. And you can download it from my Skydrive:

Wednesday, October 13, 2010

Feeling Words

开文一篇,用于记载一些平时看到,感觉挺有道理的话:

Most important, have the courage to follow your heart and intuition.

--Steve Jobs Stanford Commencement Speech 2005

Don't let the noise of others' opinions drown out your own inner voice.

--Steve Jobs Stanford Commencement Speech 2005

孤单是一个人的狂欢,狂欢是一群人的孤单。

-- 阿桑《叶子》

孤独是人的宿命,它基于这样一个事实:我们每个人都是这世界上一个旋生旋灭的偶然存在,从无中来,又要回到无中去,没有任何人任何事情能够改变我们的这个命运。

-- 周国平《爱与孤独》

下君尽己之能,中君尽人之力,上君尽人之智

--《孙子兵法》

没有比漫无目的地徘徊更令人无法忍受的了

-- 荷马史诗《奥德赛》

等待是最漫长的绝望,绝望是最完美地等待

--未知来源

more adding...

组会随感

今天下午开例会,在讨论中,感觉受益匪浅,自己也有一些体会,写日志一篇mark之。

1.关于选题:

计算机作为一门工程学科,选题其实最大的来源还是工程实践,也就是工程中碰到的一些问题。但是,作为学术研究来讲,就需要把工程中的具体问题挖掘出来,形成一类问题,或者说一个问题模型。比如说,我们在芯片设计中会碰到关于两个时钟域的同步问题,也许从工程角度,我们可以找到一个很简单的方法解决,某个时钟域每隔一定时间发送时钟信息给另外一个时钟域;但是,从研究角度,我们就可以对其进行抽象:其实这问题的本质是一个分别分布式系统的时钟同步问题,这又涉及到了各种情况,节点数的多少,消息传递的延时与误码率,时钟频率是否相同,等各种情况,当我们想到这一层的时候,我们的一个小工程问题就已然变成一类问题或者一个问题模型,其应用领域也大大扩宽。

另外,就是要注重选题对整个学科的意义,这一点对于做理论(发JACM这类的期刊)的尤其重要,比如说上面的时钟问题,其意义就非常重大,现代计算机的任何运算都是通过时钟来同步的,对于分布式系统来说,时钟同步就至关重要。(其实,正如cyj师兄所言,时钟问题在很多领域都是一个大问题,比如说在物理学,把时钟问题搞清楚了,相对论也就出来)。

2.关于问题的切入点

对于大部分问题,其可研究的方面有很多,还是拿上面的时钟同步问题来讲,我们可能关注同步的误差,也可能关注同步时间,对于同步所耗的时间,可以细分为平均同步时间,最优以及最差的同步时间。

由于精力与文章篇幅所限,我们不可能对问题的任何方面都去考虑,任何方面都得到一个最优解。这时候就要求我们要从某一个角度去切入。个人认为,最好的切入点就是该点是一个大家普遍关注的点,并且之前没人做过(别人做过的,去优化,除非有本质的提高,比如O(N)变成O(logN)否则意义都不大),比如说同步时间(之前很多文章都是对误差进行讨论)。

当然,切入问题的最高境界就是发现新的问题,新的领域,比如说关系数据库,图灵机模型,不过,这只是天才才能做到,我等庸人不提也罢。

3. 关于问题模型的建立

当问题切入点确定以后,就必须要对所研究的问题进行数学建模,为了简化模型,在对问题结果影响不大的情况下,我们可以在模型中舍弃一些次要参数。

有时候,即使对某些参数进行了舍弃,模型可能还太复杂,这时候我们可以考虑对模型中的某些参数进行限定。而这种限定有的不会减少模型的适用性,有的则会。

还有一个方面的考虑就是纯功利性的,那就是为了使我们所用的算法的结果更好,更有震撼力,从而文章更容易发表,也需要对某些参数进行限定(也许以后的优化工作就可以集中于减少这种限定)。

4. 关于结果的展示

当问题模型建立好后,并且我们采用了某种算法进行解决后,就需要展示结果了。

首先,展示的方式,对于理论问题,则往往只需要理论计算和证明;而对于工程问题,最重要的是试验结果(虽然很多实验结果都是在特定参数呈现的),当然,有理论支持更好。

实验结果展示的另一个方面,就是对比,要是前人有做过类似工作,就必须和前人比,尽管可能其切入点不一样。倘若没有前人做过,就必须找一种比较容易想到的算法进行比较。

That’s all~

 

btw:小记一下今天看到的雷事:

今天在未名空间看到一个新闻,讲的是我D的记者招待会,有以下雷人内容:

记者:  LiuXB妻子LiuXia为何被软禁?
马朝旭:我不认识你提到的这个人,你说的情况我也不了解。
记者:  难道你不知道LiuXB吗?
马朝旭:你刚才说的是他妻子。

我觉得甚雷,于是在oops-tech group 上分享了,谁知道,grapeot速度回复了一条更雷的:

和一个单纯MM聊天

“你知道武藤兰么?”

(MM摇头)“不知道” 
“你知道小泽圆么?” 
(MM摇头)“不知道” 
“那你知道宋慧乔么?” 
(MM大吃一惊)“她也拍那种东西?”

雷事完了,最后说一句,做人莫装纯,装纯遭人轮,人如此。。。

dolphin-crash

Wednesday, October 6, 2010

博客搬家:导出live space 到micolog或者wordpress

前段时间,微软宣布将停止live space 的服务,建议用户转移到wordpress,但是对于有些用户,比如说向我们这些用GAE+micolog搭建独立博客的用户,并不像直接搬到wordpress,或者由于各种原因,不想把live space的数据马上删除(默认转到wordpress,live space数据会删除)。因此,找一个能够把live space数据导出到micolog格式或者wordpress格式就很有必要。

我在网上找了下,终于找到了一个叫Live-space-mover的工具,并且成功的将live space 导出到micolog和wordpress,在此简要的记录一下过程。

准备工作:

1.设置live space日期格式:

重要的是让WindowsLiveSpace和Wordpress的日期格式一致,这里我两个设置的是2010/10/7。在WindowsLiveSpace中,我的时间格式是10:43,设置的路径是“选项”->“常规”->“日期和时间格式”:

image

另外,在“选项”->“日志”->“显示日志日期”选项中,勾选“在页首出显示日志发布日期”。

2.安装python:

我使用的是python2.5.2+Beautiful Soup 3.0.6,Python 2.5.2的官方下载地址在:

http://www.python.org/download/releases/2.5.2/

下载后若在命令行敲python说命令没找到,则要手动将python路径添加到环境变量,或者后续命令时把python路径敲全。

3.下载Beautiful Soup 3.0.6:

Beautiful Soup 3.0.6是一个解析HTML页面的类库,接下来那个下载博客文章的脚本需要用它。下载地址:

http://www.crummy.com/software/BeautifulSoup/download/3.x/BeautifulSoup-3.0.6.tar.gz

解压到一个文件夹,比如D:downloadBeautifulSoup-3.0.6。你将看到BeautifulSoup.py等几个脚本。

4.下载Live-space-mover:

Live-space-mover这个脚本,能够把WindowsLiveSpace中的所有文章和评论等,生成一个Wordpress能够识别的XML文件,以实现博客搬家的目的。下载地址:

http://code.google.com/p/live-space-mover/downloads/list

现在的最新版本是live-space-mover.1.8.zip。解压到Beautiful Soup 3.0.6的目录。在BeautifulSoup-3.0.6目录下,你应该看到脚本live-space-mover.py。


上述3,4两部,大家若嫌麻烦可以直接下载我打好包的Beautiful Soup 3.0.6+Live-space-mover,下载地址:

http://cid-264d14feb8ab1b38.office.live.com/embedicon.aspx/.Public/code/BeautifulSoup-3.0.6_live-space-mover.rar

搬到micolog或者wordpress:

1.导出live space:

在cmd下,cd到BeautifulSoup-3.0.6目录,若时间格式和我的一样,直接运行:

python live-space-mover.py -s http://yourSpaceName.spaces.live.com/

若时间格式后面还有秒,运行:

python live-space-mover.py -s http://yourSpaceName.spaces.live.com/ -t “%m/%d/%Y %I:%M:%S %p”

其中youSpaceName是你的博客名。倘若环境变量中没有python,则把python的路径输全即可,如:

D:\Program Files\Python25\python.exe live-space-mover.py -s http://yourSpaceName.spaces.live.com/ -t “%m/%d/%Y %I:%M:%S %p”

2.导入到micolog或者wordpress:

倘若是导入到wordpress,可以直接导入(tools->import->wordpress格式),只需设置一下作者即可。

倘若导入到micolog,则需要手动把一些中文post_name改成拼音或英文,如:

 <wp:post_name>中文</wp:post_name>




改成:



 <wp:post_name>english</wp:post_name>




否则或出现对应item没导入进去,有些文章会缺失。



wordpress评论也能够完美导入,但micolog貌似不能,我从wordpress导入到micolog也不能导入评论,所以这应该是micolog导入功能不够完善所致。




done & enjoy~

Hello world!

Welcome to WordPress.com. This is your first post. Edit or delete it and start blogging!

适用于micolog的windows live writer语法高亮插件

对于我等码农来说,在博客上贴代码是家常便饭,为了让代码更好看,代码高亮是必须的,作为离线博客最常用工具,windows live writer这方面的插件有不少,但很遗憾的是,我在网上花了九牛二虎之力,也没搜到适合我的博客平台micolog的语法高亮插件。


既然放搜狗不行,那只好自己动手,丰衣足食。于是我找了个适用于wordpress的语法高亮插件,将其更改了下,貌似原来的名字叫做HiLi,现在已经既不清了,原网址也记不清了,貌似是下网址的主人写的:


http://www.badder.cn/


我主要对代码进行了如下改动:



1. 对micolog和wordpress的高亮插件的语法进行了比较分析,从而对高亮语法的头的生成代码进行了更改,从而使值适用于micolog。


2. 对html一些特殊字符进行了自动替换,如”>”替换成”&gt”,使高亮后的代码末尾不会出现类似”<stdio.h>”的多余代码。


3. 增加了对某些行进行高亮的功能,这个功能对于比较长的代码中需要强调某行代码是很有用的。



完成后的软件界面如下:


image


下面是上面这段代码的高亮结果:



  using namespace std;

int main()
{
cout << "test"<<endl;
}

下载地址:


编译好的dll:

源码:



使用方法:把dll考入windows live writer 插件目录(默认是C:\Program Files\Windows Live\Writer\Plugins)即可.


enjoy~


btw:问一个在windows live writer上发micolog日志的问题


我用wlw发日志的时候,发现其slug无效,感觉是slug没被传输,有人碰到类似问题并且找到了解决方案吗?有的话在留言里告诉我,谢谢~

Monday, October 4, 2010

十一闲逛

rt,顺便试机,直接上图

 P1000133

P1000214

P1000302

导出live space到wordpress(附雷图一张)

MS的live space业务貌似很快就要停了,今天有空,于是想把他导出成wordpress格式北方下来

但我不想用其官方迁移工具,貌似迁移后原space就不能访问了

于是,放狗搜live space的导出工具

搜到如下地址

http://rpsh.net/archives/move-live-spaces-to-wordpress/

按一下地址操作,一切顺利

不过本文要讲的是其作者的一个小彩蛋

倒完后,我看到左上角有个just cost 30RMB的按钮,原以为是广告,怀着用了其工具,点一下广告咱就两不相欠的心态,点了一下,谁知弹出如下页面:

看来伟大的春哥真是无处不在啊,一句信春哥值一块钱啊

image

时间是把杀猪刀

从水木picture版看到的一组图,有点感触,转存于此,并附歌一曲

http://www.xiami.com/widget/802273_2088864/singlePlayer.swf

1 2

3 9

6 7

5 8 4

20

Sunday, October 3, 2010

test

test ezMultipost

and also test a picture

2 [转换]

SB qq的SB提醒

刚登陆qq,突然发现弹出一个窗口

image

靠,我的系统有漏洞,qq又不给出那漏洞的官方描述,比如类似KBxxxx号的漏洞,就随便找个理由,就想把我钓鱼到用sb的qq电脑管家。

并且,我检查了一下,我的windows更新都安装了,出现漏洞的概率是极小的。想起前段时间web qq 2.0的gmail钓鱼时间以及当下正火的360和腾讯狗咬狗的骂战,qq实在是太。。。

test

test ezMultipost

and also test a picture

2 [转换]

Friday, October 1, 2010

我的新浪微博被删了

到底我干什么了,新浪要删我微博,登陆提示“抱歉,你要访问的页面不存在或已经被删除”

截图如下

 image

网上查了下,貌似也有人有类似的经历,如某位微博用户说:

昨天,我的微博也被删了,两次致电新浪客服后,才得知是因为在微博中“刷帖”所致;再问什么是“刷帖”,答曰:就是同一内容发了多次(那是因为网速太慢,没法子确认发送成功没有造成的);三问我的微博怎样恢复,答曰:恢复是不可能了,再申请一个吧;四问为什么管理员不能先有个提示,告知注意事项,让博主今后有个注意或避免?如果再出现同类错误后再做处罚?客服答曰,对不起了;五问,能否向你们再上一级反映此事,答曰:没地方可反映了。六问为什么新浪博客和微博中存在好多淫秽的内容能够存在,我仅仅多发了几个帖子就被封了微博?客服无语。。。 
我想:每个博主为了自己的博客、微博都是牺牲了自己宝贵的时间去维护的,甚至可以说是注以心血的,同时也为“新浪”带来巨大的点击量和无穷的财富。可新浪就是这样无情地对待他忠实的的用户,删你博文!封你的博!
亲爱的博友,遇此情形,你能怎样呢?

感觉新浪这样无端删账户太狠了,对用户太不负责了,并且删账户没通过邮件(也许那封私信是通知,但我点私信的结果还是页面不存在)提醒,以后再也不用新浪微博了