运维故障总结
2015-08-21 21:20
218 查看
最近由于脚本不专业,因为依赖路径被删除,后台脚本cd失败,导致find了根目录进行查询和删除。整个服务器数据基本被干掉。教训是惨痛的,更重要的是要如果吸取教训。
恢复:
1. 定位问题: 把问题脚本停止,一般要看定时任务,后台任务等
2. 让硬盘变得只读
3. 使用extundelete和ext4magic恢复部分文件,ext4magic时可以挂接NFS来避免破坏现场
4. 导出内存中的信息,尽量的挽救更多数据
总结:
1. 运维脚本一定要规范化,特别是涉及到删除的必须要稳固,比如find和rm等命令必须要带绝对路径
2. 将数据和业务隔离,因为业务是多变的(升级,调试,安装,写日志等操作),涉及的人也比较多,会经常变动。最好是物理上隔离,做不到物理隔离,起码要在账号、目录权限上进行隔离而不互相影响。
恢复:
1. 定位问题: 把问题脚本停止,一般要看定时任务,后台任务等
2. 让硬盘变得只读
3. 使用extundelete和ext4magic恢复部分文件,ext4magic时可以挂接NFS来避免破坏现场
4. 导出内存中的信息,尽量的挽救更多数据
总结:
1. 运维脚本一定要规范化,特别是涉及到删除的必须要稳固,比如find和rm等命令必须要带绝对路径
2. 将数据和业务隔离,因为业务是多变的(升级,调试,安装,写日志等操作),涉及的人也比较多,会经常变动。最好是物理上隔离,做不到物理隔离,起码要在账号、目录权限上进行隔离而不互相影响。
相关文章推荐
- Opencv书籍
- redhat linux7.0安装没有检测到硬盘解决办法
- 使用GDI+可以方便的把OpenCV的图像矩阵类型数据显示在MFC的窗口中
- Linux中dd命令详解
- 2.0-apache日志切割
- OpenCV 谈opencv的长处与短处:模板匹配,金字塔
- linux基础操作--设置系统时间
- linux基础操作----任务调度指令
- Linux根文件系统构建
- NSOperation
- linux基础教程---设置文件的主人、组别
- linux基础操作----权限管理
- OpenCV------- 对XML和YAML文件实现I/O操作
- 显示图片,VS2010, MFC, OpenCV2
- solr启动时报错org.apache.solr.common.SolrException: undefined field text的解决办法
- OpenCV 完全安装 新增VS2010+OpenCV2.1,新增VS2010+OpenCV2.3.1
- nginx+php部署
- 操作系统虚拟内存中的四种典型页替换算法(OPT,LRU,FIFO,Clock)
- Linux NetHogs监控工具介绍
- 【LeetCode】138. Copy List with Random Pointer