您的位置：首页 > 理论基础

关于计算机视觉的各种库儿们

2014-07-24 16:06 411 查看

这个页面力图搜集各种跟CV，AR相关的代码，如无特别声明，均是c/c++代码。还是一贯的标准，不求全面，只求质量。

如有特别推荐的代码，请在本页留言，或者email我：cvchina AT gmail.com

通用库/General Library

OpenCV

无需多言。

RAVL

Recognition And Vision Library. 线程安全。强大的IO机制。包含AAM。

CImg

很酷的一个图像处理包。整个库只有一个头文件。包含一个基于PDE的光流算法。

图像，视频IO/Image, Video IO

FreeImage

DevIL

ImageMagick

FFMPEG

VideoInput

portVideo

AR相关/Augmented Reality

ARToolKit

基于Marker的AR库

ARToolKitPlus

ARToolKit的增强版。实现了更好的姿态估计算法。

PTAM

实时的跟踪、SLAM、AR库。无需Marker，模板，内置传感器等。

BazAR

基于特征点检测和识别的AR库。

局部不变特征/Local Invariant Feature

VLFeat

目前最好的Sift开源实现。同时包含了KD-tree，KD-Forest，BoW实现。

Ferns

基于Naive Bayesian Bundle的特征点识别。高速，但占用内存高。

SIFT By Rob Hess

基于OpenCV的Sift实现。

目标检测/Object Detection

AdaBoost By JianXin.Wu

又一个AdaBoost实现。训练速度快。

行人检测 By JianXin.Wu

基于Centrist和Linear SVM的快速行人检测。

（近似）最近邻/ANN

FLANN

目前最完整的（近似）最近邻开源库。不但实现了一系列查找算法，还包含了一种自动选取最快算法的机制。

ANN

另外一个近似最近邻库。

SLAM & SFM

SceneLib [LGPL]

monoSLAM库。由Androw Davison开发。

图像分割/Segmentation

SLIC Super Pixel

使用Simple Linear Iterative Clustering产生指定数目，近似均匀分布的Super Pixel。

目标跟踪/Tracking

TLD

基于Online Random Forest的目标跟踪算法。

KLT

Kanade-Lucas-Tracker

Online boosting trackers

Online Boosting Trackers

直线检测/Line Detection

DSCC

基于联通域连接的直线检测算法。

LSD [GPL]

基于梯度的，局部直线段检测算子。

指纹/Finger Print

pHash [GPL]

基于感知的多媒体文件Hash算法。（提取，对比图像、视频、音频的指纹）

图像检索/Image Retrieval

libpmk

Pyramid Matching Algorithm实现。

vocsearch

一个简单的的Vocabulary Tree实现。

视觉显著性/Visual Salience

Global Contrast Based Salient Region Detection

Ming-Ming Cheng的视觉显著性算法。

FFT/DWT

FFTW [GPL]

最快，最好的开源FFT。

FFTReal [WTFPL]

轻量级的FFT实现。许可证是亮点。

音频处理/Audio processing

STK [Free]

音频处理，音频合成。

libsndfile [LGPL]

音频文件IO。

libsamplerate [GPL ]

音频重采样。

转自 http://www.cvchina.info/codes/

转自数学的美学世界

================================================================

(转)40多个关于人脸检测/识别的API、库和软件

本文转自伯乐在线

自从谷歌眼镜被推出以来，围绕人脸识别，出现了很多争议。我们相信，不管是不是通过智能眼镜，人脸识别将在人与人交往甚至人与物交互中开辟无数种可能性。

为了帮助研究过程中探索人脸识别，我们列出以下人脸检测和识别API。希望有所帮助！

Face Recognition - 拉姆达实验室斯蒂芬弄的。示例代码和图形演示点击http://api.lambdal.com/docs，我们的API提供了面部识别，面部检测，眼睛定位，鼻子定位，嘴巴定位，和性别分类。如果您有任何疑问，只需发一封邮件到s@lambdal.com。
Face (Detection) - 计算机视觉面部识别和面部检测。这是一个完美的face.com替代品。目前，我们有一个免费的API进行人脸检测。
Animetrics Face Recognition - Animetrics的人脸识别API可用于图片中的人脸检测。面部特征或“地标”的信息被返回作为图象上的坐标。 Animetrics人脸识别也会在三维坐标轴上侦测并返回脸部位置信息。
Skybiometry Face Detection and Recognition一个易于使用的人脸检测与识别的API。必须在您的SkyBiometry帐户中创建应用程序来使用它。（如果你还没有帐户，请先注册）。
ImageVision Face Detection - 测试版发布更好的人脸检测服务！ImageVision是一个计算机视觉公司改进技术，确定在任意的（数字）的图像中的人脸的位置和大小。
Face and scene recognition by Rekognition.com - Face.com的替代品！快速，强大和可扩展的rekognition引擎可以做面部检测，采集，识别，场景理解！它可以自动训练使用Facebook上的图像和标签！
FaceRect - FaceRect是一个功能强大且免费的API进行人脸检测，能够发现网页中的或者上传文件中特定图片上的脸部（包括正面和侧面），并能够在一张图片中找到多张人脸，生成的 JSON输出每个脸部的边界框。
Infatics Face Detection -简单的人脸检测API。
OpenCV Face Recognizer -基于OpenCV（开源计算机视觉库： http://opencv.org ）是一个开源的BSD授权的库，其中包括数百个计算机视觉算法。
Libface - Libface库旨在使人脸识别技术应用于开源社区。这是用C++编写的，托管在 Sourceforge上。这个库使用 OpenCV 2.0 ，目标是成为一个中间件，在人脸识别和检测时，开发人员不必包括任何OpenCV的代码。
Automatic naming of characters in video 用来是标记电视或电影每个帧中出现的人名。
CCV -现代计算机视觉库。
OpenBR-开源的生物特征识别。
Flandmark -开源实现面部地标探测器。
计算机表情识别工具箱（CERT）-一个终端到终端的完全自动化的实时面部表情识别系统。
Nviso 3D facial imaging technology-从面部表情分析人类的情感。比任何其他方法更直接和自动化。
FaceReader- FaceReader是世界上第一个能够自动分析面部表情的工具，使用户能够客观的评估一个人的情绪。
Affdex - - 通过摄像头，Affdex从面部表情读取的人们的情绪状态，比如喜好和兴趣，使营销人员更快，更准确地洞察到消费者对品牌和媒体的回应。
Faceware - 分析仪从视频中抓取一个演员的面部表现，生成用于在Retargeter™ 的IMPD文件。它通过将用户在前端的简单输入和在后端的复杂的计算机视觉算法组合起来实现这一功能。
20. Face detection in iOS-在iOS中的人脸检测。
Face-Recognition-SDK-在您的应用程序添加面部识别。
Oddcast face detection API-这个人脸跟踪API允许Flash开发人员利用以前只在高端视频游戏中使用的高级技术。
BioID-世界上第一个基于摄像头的个人识别。
Betaface API-人脸检测和识别。
Discrete Area Filters Face Detector—可检测脸部15个点，4个部分，多张脸，或遮住的脸。
Face detection using Support Vector Machine-该程序是克隆MATLAB中的“人脸检测系统”，可以代替神经网络算法的人脸检测，它是基于
SVG。
fdlib - 是一个 C / C + + 和 MATLAB的人脸检测库，可检测图像中的正脸。
Visage-一个人机接口，旨在用脸部取代传统的鼠标。用一个摄像头，将脸部面相的运动变成鼠标指针的运动。如左/右眼睛闪烁产生左/右鼠标点击事件。
Face tracking Project（卡耐基梅隆大学）–结合可变形模板和颜色匹配来跟踪脸部。
Real-time face detection program（实时人脸检测程序）-来自德国弗劳恩霍夫研究所IIS的演示。展示了用边缘定位匹配的面部跟踪和检测。
Evaluation of Face Recognition Algorithms-来自科罗拉多州立大学研究人员开发的人脸识别算法，它提供了一套标准的众所周知的算法，并建立实验协议。
Computer Vision Source Code-实用的图像处理代码集合。
Acsys biometrics SDK（ACSYS生物识别SDK ）-允许第三方开发者用先进的面部生物识别技术来实现自己应用。
Cognitec SDK-为世界各地的企业和政府客户开发领先的人脸识别技术和应用。
KeyLemonFaceSDK-为主要的操作系统提供集成识别技术。
FaceIT SDK
FaceSDK- 人脸识别和基于面部的生物识别功能，易整合。
Verilook SDK-–使用了VeriLook算法，该算法确保快速和可靠的面部识别。
Beyond Reality Face SDK-在视频流中的一张简单图片上，计算面部位置和3D角度。这些信息可以被用来将三维对象放置到图像上，或通过头部运动控制一个应用程序。
InSight SDK-通过测量面部肌肉的运动，对人脸进行完全自动化分析，并将这些面部肌肉运动转化为七个普遍的面部表情。
Visage FaceDetect SDK-以C++软件开发工具包的形式，包含了很多在静止图像中发现脸和五官的有用技术。
Microsoft Research Face SDK Beta- 集成了微软研究团队最新的面部识别技术。
How To: Kinect for Windows SDK Face Recognition
Bayometric FaceIt Face Recognition SDK-结合了传统的面部皮肤生物识别技术。
FacePhi FaceRecognition SDK –包含了一组.NET和Silverlight库
360Biometrics
Face SDK-非常先进的脸部识别系统，用来将人脸图像嵌入或链接到已有的数据库中。
Hunter TrueID
IMRSV-现实世界中的实时感知计算软件，用一个基本的摄像头，就可以测量25英尺外，多达25人的性别，年龄，关注点，目光等信息。它也有一个REST API（应用编程接口）
Bob-一个信号处理和机器学习工具箱，最初是由IDIAP研究所的生物识别技术团队在瑞士开发的。

==========================================================================

新增部分

Face++是新一代云端视觉服务平台，提供一整套世界领先的人脸检测，人脸识别，面部分析的视觉技术服务。
Face++旨在提供简单易用，功能强大，平台通用的视觉服务，让广大的Web及移动开发者可以轻松使用最前沿的计算机视觉技术，从而搭建个性化的视觉应用。Face++同时提供云端REST API以及本地API（涵盖Android, iOS, Linux, Windows, Mac OS），并且提供定制化及企业级视觉服务。通过Face++，您可以轻松搭建您自己的云端身份认证，用户兴趣挖掘，移动体感交互，社交娱乐分享等多类型应用

VMX Project：一个人人可用的目标识别系统

这个是由MIT的大神Tomasz Malisiewicz 创业的公司Vison.AI开发的软件。这个软件提供了先进的目标识别算法，而且提供了非常易于使用的API。

这个系统可以接受摄像头的输入，youtube输入等等，一切能在电脑上显示的视频。

软件是基于chrome和firefox等浏览器的，用户只需要有一台电脑，一个摄像头就可以使用。这个软件我自己还没有尝试过，如果大家有人自己试过了效果，欢迎在此分享用户体验。

之前这个系统都只提供在线计算的接口，由于用户呼吁，他们最近又开发了离线版的API。

下面可以看到这个系统的效果，详细内容参见他们的创业网站

http://www.kickstarter.com/projects/visionai/vmx-project-computer-vision-for-everyone
微软的人脸处理SDK

2012年5月，微软研究院发布了基于Windows
Phone平台的人脸技术软件开发工具包测试版（Face
SDK Beta for Windows Phone）。这套首次公开发布的测试版SDK（Software Development Kit，软件开发工具包），提供多种先进的算法用以处理人脸图像，比如人脸检测、校准、跟踪和动画生成等等，让开发者和发烧友轻松愉快地开发出更多有趣的 Windows Phone应用。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航