CUDA Host Memory Models
之前写CUDA程序时光顾着如何加速跑在device(GPU)端的kernel function了,没太关注host(CPU)端的代码,直到上个月发现了我某个CUDA程序中的坑——host端内存模型使用不当导致在CPU和GPU之间的数据传输消耗了大量时间,这种overhead甚至占到了总时间的70%以上,成为最主要的瓶颈(bottleneck)。在填完这 …
之前写CUDA程序时光顾着如何加速跑在device(GPU)端的kernel function了,没太关注host(CPU)端的代码,直到上个月发现了我某个CUDA程序中的坑——host端内存模型使用不当导致在CPU和GPU之间的数据传输消耗了大量时间,这种overhead甚至占到了总时间的70%以上,成为最主要的瓶颈(bottleneck)。在填完这 …
今晚去听布达佩斯节日管弦乐团(Budapest Festival Orchestra)的音乐会。 BFO成立至今也不过三十年,却早已成为享誉全球的著名乐团,甚至在《留声机》的一次排名中被列 …
几个月前我就看到了伦敦交响乐团(London Symphony Orchestra)音乐会的消息,当时就觉得这一场不容错过。
首先是阵容很强大:LSO是一个跟BPO、VPO并称三巨头的腐国英国 …
昨晚去听了Angela Hewitt的钢琴独奏会。Hewitt的演出还是挺难得的——她08年曾来帝都弹《平均律》,对观众的表现留下了不好的印象,之后就已经基本不来大陆了。这次的曲目也很有意思,上 …
前段时间学校的EECS楼发生火灾,最近隔三差五停电检修,打断我在server上跑的实验。 而且我习惯上用tmux开多个session和window,一遇到停电我的tmux现场就悲剧了。 复电重开机之后要把tmux现场手动重新建好也很麻烦,于 …
一开始看到阿巴多大师辞世的消息还以为是网上的谣言,等到查了wiki上的链接才确信了这一古典音乐界的噩耗。 尽管与肺癌斗争了十余年,大师在复出后仍然精力 …
最近跟舍友小书虫借了一本心理学家弗洛姆的著名作品《爱的艺术》:
与浩如烟海的扯淡文艺书不同,这本一百来页的小书 …
这篇日志应该叫「六美分历险记」的,「六美分」顾名思义嘛,自然是指CentOS-6。
下面扯扯为何对本屌来说是「历险」和为虾米要「历险」: 偶对 …
CBSO (City of Birmingham Symphony Orchestra)的这场音乐会还是偶在台北听的第一场音乐会。
<剧透>下面容我碎碎念一会~</剧透>
<碎碎念>
说来惭愧,偶去年来 …
写blog确实是一种消化和深入理解知识的方式,但往往要整理一个完整的主题相当的耗时间。 平时我也想记一记一些有用然而散乱的tips,慢慢积累起来。 作为一位Vim忠实粉 …