MLY -- 14.Evaluating multiple ideas in parallel during error analysis
2017-02-27 12:44
381 查看
你的团队有提高猫检测器的几个点子:
解决狗被分类为猫的问题
解决“大猫”(狮子,豹等)被认为是家猫(宠物)的问题
提高系统在模糊图像上的性能
……
你可以并行地评估所有这些点子。我通常创建一个电子表格,并在查看这100张误分类开发集图片时填写这张表格,并记下有助于我记起具体是哪个例子的评论。下面用四个图片来演示我是怎么做的:
上面的图片3既是大猫又是模糊图片:一个例子可以属于多种类别。这就是为什么表格底部的百分数加起来不等于100%的原因。
虽然在上述描述过程中,我首先确定类别(狗,大猫,模糊图片),然后将误分类图片分到每个类别中,在实际中,一旦你开始查看那些抽取的误分类图片,你可能会被启发从而提出新的类别。例如,你在查看了十几个图片后,意识到很多误分类图片是被Instagram过滤器预处理过后的图片。此时,你就可以在电子表格上加上Instagram一栏了。人工查看误分类图片,并在查看时问问自己如何/是否能够给出这些图片的正确标签,将能启发你提出新的错误类别和解决方案。
最有用的错误类别是针对它你已有了提升方案的类别。例如,Instagram类别将是最有用的,如果你有了一个“撤销”Instagram过滤器从而将图片恢复到原始图片的方法。但你不必纠结于已经有了改进想法的错误类别;错误分析阶段的目标是建立你关于“哪个领域是最有前途的、最值得关注的”的直觉。
错误分析是一个迭代过程。你可以从没有任何类别开始。通过查看图像,你可能会想出一些关于错误类别的ideas。然后,在对一些图片手工分类后,你可能会受到启发并提出新的类别,然后返回按照新类别重新检查图片,重复此循环。
假设你完成了100个误分类开发集图片的错误分析,并得到:
你现在知道了强调消除狗狗错误的项目最多只能消除8%的错误,致力于消除大猫和模糊图片的错误能够提高更多。你可以致力于后两个类别之一。如果你的团队有足够的人,可同时追求多个方向,你可以要求一些工程师致力于大猫和模糊图片两个类别。
错误分析不会产生一个刚性(rigid)的数学公式,告诉你哪个任务应该是优先级最高的。你还必须考虑你希望在不同类别上取得多少进展,以及处理每个类别所需的工作量。
解决狗被分类为猫的问题
解决“大猫”(狮子,豹等)被认为是家猫(宠物)的问题
提高系统在模糊图像上的性能
……
你可以并行地评估所有这些点子。我通常创建一个电子表格,并在查看这100张误分类开发集图片时填写这张表格,并记下有助于我记起具体是哪个例子的评论。下面用四个图片来演示我是怎么做的:
image | dog | great cat | blurry | comments |
---|---|---|---|---|
1 | √ | 不平常的斗牛犬颜色 | ||
2 | √ | |||
3 | √ | √ | 狮子;雨天在动物园拍摄的照片 | |
4 | √ | 树后面的豹 | ||
% of total | 25% | 50% | 50% |
虽然在上述描述过程中,我首先确定类别(狗,大猫,模糊图片),然后将误分类图片分到每个类别中,在实际中,一旦你开始查看那些抽取的误分类图片,你可能会被启发从而提出新的类别。例如,你在查看了十几个图片后,意识到很多误分类图片是被Instagram过滤器预处理过后的图片。此时,你就可以在电子表格上加上Instagram一栏了。人工查看误分类图片,并在查看时问问自己如何/是否能够给出这些图片的正确标签,将能启发你提出新的错误类别和解决方案。
最有用的错误类别是针对它你已有了提升方案的类别。例如,Instagram类别将是最有用的,如果你有了一个“撤销”Instagram过滤器从而将图片恢复到原始图片的方法。但你不必纠结于已经有了改进想法的错误类别;错误分析阶段的目标是建立你关于“哪个领域是最有前途的、最值得关注的”的直觉。
错误分析是一个迭代过程。你可以从没有任何类别开始。通过查看图像,你可能会想出一些关于错误类别的ideas。然后,在对一些图片手工分类后,你可能会受到启发并提出新的类别,然后返回按照新类别重新检查图片,重复此循环。
假设你完成了100个误分类开发集图片的错误分析,并得到:
image | dog | great cat | blurry | comments |
---|---|---|---|---|
1 | √ | 不平常的斗牛犬颜色 | ||
2 | √ | |||
3 | √ | &radic | 狮子;雨天在动物园拍摄的图片 | |
4 | √ | 树后面的豹 | ||
… | … | … | … | … |
% of total | 8% | 43% | 61% |
错误分析不会产生一个刚性(rigid)的数学公式,告诉你哪个任务应该是优先级最高的。你还必须考虑你希望在不同类别上取得多少进展,以及处理每个类别所需的工作量。
相关文章推荐
- 14. Evaluate multiple ideas in parallel during error analysis 错误分析时并行评估多个想法(《MACHINE LEARNIN
- Android Studio 解决Error occurred during initalization of VM
- FAILED: Error in semantic analysis: No matching method for class org.apache.hadoop.hive.ql.udf.GetEx
- python UnicodeEncodeError: 'ascii' codec can't encode characters in position 13-14: ordinal not in r
- rsyslogd: error during parsing file /etc/rsyslog.conf, on or before line 55: warnings occured in fil
- Python: joblib.Parallel method in a class 'TypeError : can't pickle instancementhod objects'
- Error:duplicate files during packaging of APK Path in archive: META-INF/LICENSE.txt
- Error (10028): Can't resolve multiple constant drivers for net "out2" at shiyan.v(14)解决办法
- rsyslogd: error during parsing file /etc/rsyslog.conf, on or before line 55: warnings occured in fil
- Scraping multiple sites in parallel and memory consumption - Google Groups
- Error:(311) Multiple substitutions specified in non-positional format
- rsyslogd: error during parsing file /etc/rsyslog.conf, on or before line 55: warnings occured in fil
- REGDB_E_CLASSNOTREG error in analysis server 2008
- UnicodeEncodeError: 'ascii' codec can't encode characters in position 9-14: ordinal not in range(128
- 【xml String format】error: Multiple substitutions specified in non-positional format;
- ISSCC 2017论文导读 Session 14:ENVISION: A 0.26-to-10 TOPS/W Subword-Parallel DVAFS CNN Processor in 28nm
- brew Error: Formulae found in multiple taps
- Error in invoking target ntcontab.o During CRS installation [ID 443675.1]
- ISSCC 2017论文导读 Session 14:ENVISION: A 0.26-to-10 TOPS/W Subword-Parallel DVAFS CNN Processor in 28nm
- Fatal error: Class 'Illuminate\Foundation\Application' not found in /[path_to_laravel_app]/bootstrap/start.php on line 14