BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

SNDACode介绍

| 作者 徐文 关注 0 他的粉丝 , 庄表伟 关注 0 他的粉丝 发布于 2011年9月7日. 估计阅读时间: 7 分钟 | AICon 关注机器学习、计算机视觉、NLP、自动驾驶等20+AI热点技术和最新落地成功案例。

一、SNDACode和它的发展

SNDACode是盛大创新院旗下的一个开源平台,主要用于展示盛大集团开放的源代码及API,也有盛大员工个人开发代码的展示。覆盖的项目包含语音,云计算,开发框架,SDK等领域。开发者可以从SNDACode可以看到盛大最新的开源项目,也可以在上面提交issues,进行交流。除了特别声明的软件外,SNDACode上面的所有软件都遵循GPLv2协议开源。下面是简要介绍一下其中的几个项目。

二、SNDACode上的项目介绍

Snda Humming

哼唱检索是一种基于音乐旋律内容的音乐检索方式,使得用户可以通过哼唱歌曲旋律的一个片段作为输入检索源从歌曲旋律库中检索音乐。相对于传统基于文本关键字的音乐检索,哼唱检索给用户提供了更便捷、更友好的查询方式,不仅作为传统文本检索的一种有益补充,而且能给用户带来更佳的搜索体验。

使用C++作为开发语言的Snda Humming,利用MIDI文件中包含的旋律信息构建旋律库。IDI (Musical Instrument Digital Interface)文件记录了歌曲乐谱音高,时长,力度等旋律信息。此外,为了支持用户可以从一首歌的任何位置开始唱起这一功能,系统采用乐句切分方法,定位搜索入口点。

与同类型软件相比,SNDA Humming采用了一种对用户哼唱不加任何限制的语音输入方式,用户可以自然的输入哼唱旋律,如可以唱出歌曲的歌词,或者唱出乐谱,甚至可以用鼻音、无意义的音节哼出歌曲的曲调。

在算法的采用上面,欧氏距离(Euclidean Distance)和动态时间弯曲距离(Dynamic Time Warping Distance)的结合使用,让SNDAHumming能更加精确地计算出旋律相似度。

本软件的前身在2008年的国际音乐检索评测中获得第一名,识别准确率高,响应速度快。具有良好的扩展性,用户可根据需求制作自己的音乐旋律库。可以为对音频信息处理领域感兴趣的开发者提供了完整的学习案例和试验平台。

PHPCMS

采用PHP5+MYSQL做为技术基础进行开发,遵循OOP(面向对象)方式进行基础运行框架搭建。以模块化做为功能开发的形式,使得框架结构更为清晰,代码更易于维护。也让扩展性得到保证。

另外PHPCMS在开源CMS中率先引入站群系统,多发布点,数据表分离等功能。

所谓站群是指建立在统一标准、统一技术构架基础之上,分级管理,分级维护,信息可以实现基于特定权限共享呈送的网站集合。并不是把很多个网站集中在一起就可以称得上是站群了。PHPCMS实现了技术标准统一,站点间互联互通,比如单点登录等。

通过发布点对应的FTP配置信息,可以将多个站点分别部署到不同服务器上,分站域名指向站点内容所属目录或服务器,轻松实现多域名访问和服务器集群布置。

PHPCMS在系统构架中,为每个数据表分别建立不同的数据模型文件,此文件中配置了该表所属数据库服务器IP,表前缀、表名等相关信息。系统程序运行中通过加载相关表的配置文件,来建立该表的数据模型类,进而操作该表。让用户将数据表分离到不同的数据服务器上,实现强大的负载均衡。

tcdatabase

SNDACode上的很多项目是员工个人开发的,tcdatabase就是其中之一。以TC(Tokyo Cabinet)的B+Tree 数据引擎为基础开发的数据库。利用TokyoTyrant中的 skeleton功能实现扩展。可以使用以下代码启动:

 

ttserver -skel tcdatabase.so -port 3900 db_filename.tcb

 TC(Tokyo Cabinet)是日本人平林幹雄开发的一款 Key-Value 键值数据库。TT(Tokyo Tyrant )是由同一作者开发的 Tokyo Cabinet 数据库网络接口。它拥有自己的协议,并支持Memcached兼容协议,也可以通过HTTP协议进行数据交换。TCTDB的读写性能很强,又支持MySQL单表的一些功能,但任然有许多的不足。

TCDatabase就是在这个的基础上进行改进。在TCDatabase中支持多个table从一个端口访问,实现了Table Database支持多个表。原有TCTDB功能增强,读写性能损失过大的问题也在其中得到了解决。数据文件改用采用TCBDB(B+Tree Database)进行存储,数据量上亿后性能也不会明显下降。

在性能优化的基础上,TCDatabase能够区分value的类型,建立数值索引。同时支持列读写,可以单独获取更新value中的某一字段。另外还能够限制查询的时间实现慢查询。TCDatabase强大的功能使之有可能成为云数据库的数据引擎。

Jscex

Jscex是JavaScript Computation EXpressions的缩写,它为JavaScript语言提供了一个monadic扩展。Jscex项目完全使用JavaScript编写,能够在任意支持ECMAScript 3的执行引擎里使用。小巧而强大,JIT编译器能在运行时将JavaScript代码编译成Monad形式,无需额外编译步骤,并内置异步编程类库,可以大大简化JavaScript下的异步编程体验。

三、盛大目前开源状况以及开放的API

除了上面介绍的项目之外,盛大Bambook,everbox的SDK也在SNDACode上公开了源代码。Bambook是盛大旗下经典的电子阅读器平台,everbox则是大容量网盘。开发者可以利用其开放的API编写丰富的应用。

另外还有其他一些有趣的项目,比如说用于消息队列管理的DOMQ,java/jsp的敏捷开发框架xiaojie's framework等等。感兴趣的同学可以访问SNDACode.com了解更多的项目。也希望这个平台能够促进开发者之间的交流,为国内的开源事业发展尽一份绵薄之力。另外SNDACode下的一个开源程序比赛的平台也正在筹划过程中,更多的实时信息也可以关注SNDACode的新浪微博SNDACode


感谢张凯峰对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家加入到InfoQ中文站用户讨论组中与我们的编辑和其他读者朋友交流。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

要跨栏呀 by jiang ming

要跨栏呀

Re: 要跨栏呀 by 杨 振涛

软文么?

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

2 讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT