您的位置:首页 > 理论基础

黄聪:Python+NLTK自然语言处理学习(三):计算机自动学习机制

2011-08-29 18:30 381 查看
本文演示使用NLTK让计算机学习如何通过名字识别性别。

1、导入NLTK:

import nltk
from nltk.book import *


2、定义学习方法

def gender_features(word):
return {'last_letter':word[-1]}


3、导入学习的姓名-性别名单:

from nltk.corpus import names
import random
names=([(name,'male') for name in names.words('male.txt')] + [(name,'female') for name in names.words('female.txt')])
random.shuffle(names)


4、开始学习

f = [(gender_features(n),g) for (n,g) in names]
trainset,testset = f[500:],f[:500]
c = nltk.NaiveBayesClassifier.train(trainset)


5、测试:

c.classify(gender_features('Neo'))
c.classify(gender_features('Trinity'))


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: