欢迎自己创立了这个博客 For PCSGroup

04月 10th, 2011

复杂环境下多目标跟踪与识别算法研究——在参与了这个项目,并在其中不断学习与研究的过程中,产生了很多神奇的想法。并且这个项目怎么来说也得有个正经的地方存放自己的研究进程吧,这样才像个项目。在Google上四处找寻,发现了blogcn这个地方,各种要求都符合,于是驻扎于此,算是给项目买了个房子,安顿了下来。这是个77元房,政府拨款不少,所以自己也没掏太多的钱~~说远了,就拿这篇日志作为开篇日志吧,在这里祝项目顺利结题,祝项目研究硕果累累!!!

——from blackhuman at 11:00 p.m. in his own dormitory

捣鼓一下AutoHotKey(AHK)

09月 1st, 2011

从标准例子中学到了快捷键的用法。 在Ghoster文件的Exit标签前写了快捷键,执行快捷键后调用Control文件,然后调用Exit标签并结束程序。 Control文件中有同样的快捷键,执行Ghoster文件,并结束自己。 用到的命令: #z:: Run,Ghoster Read More...

与MP3标签(ID3)有关的

08月 30th, 2011

现在的很多音乐程序以及播放器都是直接识别ID3标签的,标签不规范,用起来就很麻烦。比如ID3不全,ID3的信息播放器上不能识别等问题。今天,我们就一一解决这些问题。 1.ID3版本问题导致播放器不能识别,有可能出现乱码现象。我在Music Beta by Google上,以及我的BB8800上遇到过。 这个问题的解决方法就是加入足够的ID3版本信息,这篇文章提供了方法。看下面的截图就会一清二楚。软件使用的是mp3tag。 如图,即将所有版本的ID3信息写入mp3文件。其中ID3v2要使用ID3v2 Read More...

如何在WordPress上架设博客(blogcn版)

08月 30th, 2011

由于blogcn改变后提供了wordpress这个强大的博客平台,省去了很多自己架设的麻烦。本文下面的文字建立在博客已经架设好并且已经创建了一个可以有博客后台访问权限的账号(在blogcn中即已经申请了一个账号,并且创建了一个博客)。 (阅读全文……)

usenet研究告一段落

07月 23rd, 2011

自从知道了usenet这个东西后,花在查找相关内容的时间已经很多了,现在大概摸透了usenet的各个部分:服务商、客户端、在国内的状况。 服务商很多,有名的就是usenext和giganews,但是钱都很贵。这些服务商提供的服务主要就是二进制文件(盗版视频、音乐、书籍、软件、游戏等)的下载,速度很快,能满速。我注册的usenext试用账号在我学校的下载速度到了500K,很快吧,而且各种资源很丰富,不过当然都是英文资源。可恶的英语啊~~ 如果只看text类的组,那么google group足够了。google group收购了一个usenet服务商,1981之后的text组内容都有存档,而且现在还在持续从服务器上获取存档,大概10分钟不到就能更新。最重要的是google group 免费,当然,在这里访问要翻的。 客户端有收费的和免费的。grabit免费,但是只能读取text组,连图片都看不了;NewsLeecher收费,但有破解;NewsBin专门用来下二进制文件(NZB文件),有破解;UseNeXT只能使用自己的账号;Mimo也是Giganews的专用软件。我使用的是NewsLeecher,看text新闻组也不错,能看到图片。 在国内,虽然不墙usenext但大家很少用这个下二进制,主要是价格和里面只有英文资源。要用text类新闻组就用google group吧,总之国内是不怎么流行用这个的。我一开始的想法是在usenext上关注最新技术,但发现这里英文远非我能消化的,所以先写下这篇文章,以后慢慢在用吧。 另外,附上两个下载破解的地方,海盗湾(要翻)和megashares Read More...

kindle DXG看电子书利器

07月 23rd, 2011

一直想要款电子书阅读器,于是最近盯上了Kindle DXG。 讨论这个东西的有两个论坛,一个是http://bbs.mydoo.cn/forum-28-1.html,另一个是多看这个三方操作系统的论坛http://www.duokan.com/forum/index.php。希望能最早入手这款要价近3k的kindle DXG,期待中。

一个新的web2.0网站

07月 19th, 2011

今天偶然发现了一个web2.0网站(dotsub.com)和一个系列的视频(X In Plain English),在这里介绍一下。 dotsub.com的特点在于它给每个视频加了一个字幕,在网友的贡献下,这些视频就被添加了各个国家的字幕。我就是在这里找到了我要看的“Blogs In Plain English”的英文字幕和中文字幕,很是Happy啊。 这里附上X In Plain English系列视频的地址 http://dotsub Read More...

看完了一本英文技术书 OpenCV 2

07月 11th, 2011

纪念下,第一次看了这么多的英文技术书,而且越看越轻松,我发现英文技术书籍没那么可怕。 < OpenCV 2 Computer Vision Application Programming Cookbook >是一本围绕OpenCV 2.x中的C++接口叙述的计算机视觉相关的图书。我看了前三章,也就是如何使用新的OpenCV C++接口。其实经过C++封装后,我们程序员写出的代码就更简练、直观了,越来越趋向于Matlab代码了,当然在处理速度上有matlab代码不可比拟的优势。这样我们就可以将更多的经历放在算法设计上了,而不是那些烦人的语法与内存管理问题了。 书很好,推荐,最后给出这本书的电子版下载地址:点我(大概需要翻人比黄花瘦墙)不过也许iask上就有了,你试试吧。

YUV转RGB,颜色空间及其他

07月 3rd, 2011

使用某国内山寨4路录像机录制出来的文件以及视频流的的编码格式是h264的,使用其自带SDK解码后成为YUV420格式,但是这个YUV420格式可不是OpenCV可以直接使用的,所以就出现了转换的问题。转换之前需要先研究下YUV420的编码到底是怎么编的。 其他可以Google到的就不说了,我就说说对这方面的知识体系的理解。这些知识设计到的就是多媒体编程了,视频制式等制式。我能想到的是:一、各种颜色空间需要掌握,特别是RGB各类和YUV各类颜色空间。二、DirectShow中对各颜色空间的支持,以及基本的DS编程方法。 等深入了解了YUV之后再继续这篇文章,现在了解的YUV信息太少,不足以撑起整篇文章。 参考网址: http://www Read More...

FFMPEG编译使用以及FFMPEG在编码转换方面的应用

07月 3rd, 2011

为了将YUV420编码转化成RGB444编码,并且可以保持很高的计算速度。我最终盯上了FFMPEG这个开源库。FFMPEG有很多功能,我为了解决上面提到的那个问题,只使用了sws_scale这一个函数。下面首先说一下这个函数的用法,然后在说下如何自己从源代码编译FFMPEG。 sws_scale函数的作用是图像缩放和图像空间编码转换,它包含在头文件<libswscale/swscale Read More...

2011年7月2日

07月 3rd, 2011

新版本的检测系统出来了,这个检测系统可以直接从摄像头(通过那个录像机)读取视频流,然后解码成无压缩RGB格式放入OpenCV中处理。这个版本比上个版本的识别效果好了许多。下图是一个粗糙的界面。 核心算法仍然使用Haar-like特征和Adaboost分类器实现头部目标检测。这次比上次版本改进的地方是使用的头部正样本的取样方法不同了。以前的头部正样本的取样如下图所示,是整个图像中都填满了头部图像了。 而现在使用的取样方法是正样本头部周围还有一些背景图像,如下图所示(最后不同尺寸的图片被归一化成20*20大小)。 这样放置的正样本更符合Haar-like特征的编码习惯,在经过长时间的训练后(我一晚上训练了17层分类器,训练第18层时估计找负样本就要8个小时,就没训练了),得到一个分类器,也比以前训练得出的分类器好些(以前只训练14层)。 在对录像文件的测试中,可以发现,一般一个头部目标可以被多次检测出来,而现在的漏检率也大大下降了。不过实验发现,如果走路时扭头,漏检率就会增加,推测这是因为训练样本中扭头的图片较少,所以分类器对扭头这个方位的头像检测效果就不好。后来这个推测在后来的实验中被证明,如果朝前看走路,识别率大大提升。   最后,我认为这个检测器还可以继续提升检测效果,可以通过增加正样本库数量(扭头,各种方向的头部样本)以及增加分类器的训练层数(达到20层)来实现。