小夜时雨

君子敬其在己者,而不慕其在天者,是以日进也。

在TS过程中会碰到很多磁盘异常出现影响系统数据或者生产数据的情况,但是有时候无法判断磁盘出现问题是由于磁盘物理损坏还是磁盘SATA口接触不良导致,这个时候smartctl命令就可以很容易判断出磁盘是否存在物理损坏问题,并且及时作出预警。

Read more »

有时候需要判断设备是否处于死机状态,或者需要修改IP地址,但是又不想往机房里面跑,搬显示器等设备,那么此时通过 ipmi 或者 bmc 进入到设备 ipmi 界面,进行管理是一个非常不错的选择。但是一般配置IPMI地址需要进入到BIOS中配置,而进入到BIOS中是需要重启设备的,而ipmitool这个命令就可以在不重启设备的前提下实现这个效果,对临场判断以及解决问题有很大的帮助。

Read more »

作为一个OpenStack的初学者,要真真切切的狂舔OpenStack就必须要亲手搭建以及学习OpenStack中各个组建,以及各个组建相互之间的关系和调用,这个时候DevStack就是最好的选择。虽然网上有很多教程,但还是有一些由于OpenStack更新出现的新的坑没有人填,本文主要是记录17年底手动搭建DevStack过程,以及总结。

Read more »

近年人工智能、算法、深度学习这些技术非常火,而这些技术在用到计算能力的时候,通常都首选GPU,为了适应多用户共同学习或者处理图形图像的使用环境,基于VM配合GPU就有比较大的优势。本文主要介绍在KVM下,将宿主机上的GPU通过直通的方式提供给客户机。

Read more »

OpenStack对接ceph提供的rbd存储,在创建虚拟机的时候如果通过卷克隆方式行不通而一定要新建rbd来启动虚拟机时,这个小技巧是很有帮助的,特别是虚拟机磁盘非常大的时候,拷贝这样一个虚拟机磁盘并且上传到glance是非常花费时间的,但是通过这个方法,可以节省很多不必要的时间,例如传到glance,例如再孵化出云主机。

Read more »

工作中时常会碰到网络问题导致业务出现故障,排查问题的办法万变不离其宗,当报错太过特殊的时候,差异排除法是比较简单快捷就可以定位到问题的方法。这次就碰到由于客户IP地址更换而防火墙没有及时更新策略出现服务访问异常的问题,顺手就记录了处理过程。

Read more »

有时候碰到系统运行过程中突然出现宕机、死机,但是又不得不找原因的时候还是非常苦恼的,虽然可以通过暂时的防护机制看门狗解决眼下的问题,但是要找到宕机死机的原因,还是得靠专门针对内核进行分析的工具Kdump来实现。虽然不懂Linux内核,但是通过简单的分析还是可以得到是哪个堆栈出现异常导致宕机。

Read more »
0%