php-数据分析 余弦相似度实现
2014-06-05 22:34
316 查看
php-数据分析 余弦相似度实现
<?php
/**
* 数据分析引擎
* 分析向量的元素 必须和基准向量的元素一致,取最大个数,分析向量不足元素以0填补。
* 求出分析向量与基准向量的余弦值
* @author yu.guo@okhqb.com
*/
/**
* 获得向量的模
* @param unknown_type $array 传入分析数据的基准点的N维向量。|eg:array(1,1,1,1,1);
*/
function getMarkMod($arrParam){
$strModDouble = 0;
foreach($arrParam as $val){
$strModDouble += $val * $val;
}
$strMod = sqrt($strModDouble);
//是否需要保留小数点后几位
return $strMod;
}
/**
* 获取标杆的元素个数
* @param unknown_type $arrParam
* @return number
*/
function getMarkLenth($arrParam){
$intLenth = count($arrParam);
return $intLenth;
}
/**
* 对传入数组进行索引分配,基准点的索引必须为k,求夹角的向量索引必须为 'j'.
* @param unknown_type $arrParam
* @param unknown_type $index
* @ruturn $arrBack
*/
function handIndex($arrParam, $index = 'k'){
foreach($arrParam as $key => $val){
$in = $index.$key;
$arrBack[$in] = $val;
}
return $arrBack;
}
/**
*
* @param unknown_type $arrMark标杆向量数组(索引被处理过)
* @param unknown_type $arrAnaly 分析向量数组 (索引被处理过) |array('j0'=>1,'j1'=>2....)
* @param unknown_type $strMarkMod标杆向量的模
* @param unknown_type $intLenth 向量的长度
*/
function getCosine($arrMark, $arrAnaly, $strMarkMod ,$intLenth){
$strVector = 0;
$strCosine = 0;
for($i = 0; $i < $intLenth; $i++){
$strMarkVal = $arrMark['k'.$i];
$strAnalyVal = $arrAnaly['j'.$i];
$strVector += $strMarkVal * $strAnalyVal;
}
$arrAnalyMod = getMarkMod($arrAnaly); //求分析向量的模
$strFenzi = $strVector;
$strFenMu = $arrAnalyMod * $strMarkMod;
$strCosine = $strFenzi / $strFenMu;
if(0 !== (int)$strFenMu){
$strCosine = $strFenzi / $strFenMu;
}
return $strCosine;
}
?>
<?php
/**
* 数据分析引擎
* 分析向量的元素 必须和基准向量的元素一致,取最大个数,分析向量不足元素以0填补。
* 求出分析向量与基准向量的余弦值
* @author yu.guo@okhqb.com
*/
/**
* 获得向量的模
* @param unknown_type $array 传入分析数据的基准点的N维向量。|eg:array(1,1,1,1,1);
*/
function getMarkMod($arrParam){
$strModDouble = 0;
foreach($arrParam as $val){
$strModDouble += $val * $val;
}
$strMod = sqrt($strModDouble);
//是否需要保留小数点后几位
return $strMod;
}
/**
* 获取标杆的元素个数
* @param unknown_type $arrParam
* @return number
*/
function getMarkLenth($arrParam){
$intLenth = count($arrParam);
return $intLenth;
}
/**
* 对传入数组进行索引分配,基准点的索引必须为k,求夹角的向量索引必须为 'j'.
* @param unknown_type $arrParam
* @param unknown_type $index
* @ruturn $arrBack
*/
function handIndex($arrParam, $index = 'k'){
foreach($arrParam as $key => $val){
$in = $index.$key;
$arrBack[$in] = $val;
}
return $arrBack;
}
/**
*
* @param unknown_type $arrMark标杆向量数组(索引被处理过)
* @param unknown_type $arrAnaly 分析向量数组 (索引被处理过) |array('j0'=>1,'j1'=>2....)
* @param unknown_type $strMarkMod标杆向量的模
* @param unknown_type $intLenth 向量的长度
*/
function getCosine($arrMark, $arrAnaly, $strMarkMod ,$intLenth){
$strVector = 0;
$strCosine = 0;
for($i = 0; $i < $intLenth; $i++){
$strMarkVal = $arrMark['k'.$i];
$strAnalyVal = $arrAnaly['j'.$i];
$strVector += $strMarkVal * $strAnalyVal;
}
$arrAnalyMod = getMarkMod($arrAnaly); //求分析向量的模
$strFenzi = $strVector;
$strFenMu = $arrAnalyMod * $strMarkMod;
$strCosine = $strFenzi / $strFenMu;
if(0 !== (int)$strFenMu){
$strCosine = $strFenzi / $strFenMu;
}
return $strCosine;
}
?>
相关文章推荐
- php-数据分析 余弦相似度实现
- PHP+Hadoop实现数据统计分析
- PHP+Hadoop+Hive+Thrift+Mysql实现数据统计分析
- php实现爬取和分析知乎用户数据
- php实现爬取和分析知乎用户数据
- PHP+Hadoop实现数据统计分析
- 第二人生的源码分析(十七)人物Mesh数据显示的实现
- AJAX+PHP+MYSQL实现两个下拉框间的数据联动
- 实现BIN文件数据读取的TCL脚本分析
- php 实现两个select下拉框的数据联动
- PHP连接MySQL数据库及以表格输出数据库数据的实现
- 我的模板分析引擎类PHP的.net开发方法--功能实现篇
- 用php实现的数据网格类
- 用PHP实现ODBC数据分页显示一例
- 利用php和js实现页面数据刷新
- php采集器分析功能实现
- PHP 实现多服务器共享 SESSION 数据
- 利用php和js实现页面数据刷新
- 利用PHP-ExcelReader实现PHP导入Excel数据[不通过CSV]
- 第二人生的源码分析(十七)人物Mesh数据显示的实现