大厂的同事们,你们是怎么定位线上故障的?

7 天前
 5261

我先分享下我们小厂是怎么玩的

所有服务节点都接了 pinponit ,然后结合 kibana 收集的线上日志+traceid

分享几张今天新鲜出炉的 bug 图

今天发现根据这个 pp 的日志就很快定位到有查全表的场!

11137 次点击
所在节点    程序员
125 条回复
opengps
7 天前
小厂未必用得上你的这么高级的工具。分析办法全靠经历事故来积累经验
Pythoner666666
7 天前
日志收集 + 监控,剩下的全靠个人经验了
darksword21
7 天前
printf
5261
7 天前
@darksword21 大佬啊
ala2008
7 天前
小公司 tail -f xxx.log 啊
littlesky87906
7 天前
sentry
7gugu
7 天前
后端就是靠 TraceId 看链路+日志上报
web 就是看 JS 堆栈+日志上报来分析
MuSeCanYang
7 天前
23333 ,在全球五百强。 我们现在都没用上你这一套东西。
Ljxtt
7 天前
5261
7 天前
@Ljxtt
5261
7 天前
@littlesky87906 好,晚点我也去看下
Ljxtt
7 天前
@Ljxtt 我去,怎么多了个空格,[线上故障应急处理:4 年多 on call 经验总结]( https://jt26wzz.com/posts/0007-online-firefighting-real-world-lessions-from-4-years-on-call/)
ssiitotoo
7 天前
skywalking
jimmzhou
7 天前
var_dump();die; phper 就是任性
tpopen
7 天前
tail -f xxxx | xargs grep xxx
dddd1919
7 天前
以前写 ruby ,都是直接生产 rails console 执行代码调试🤣主打一个胆大心细
pkoukk
7 天前
kibana + trace_id 搜就行了,没空搞这些花里胡哨的,开发自己用的工具不算 KPI ,能用就行,懒得搞
msg7086
7 天前
我们都是 tail -f 大法
kevinxzhao
7 天前
大盘监控 + 链路追踪 + 查日志。
darkengine
7 天前
tail -f, grep 😂

哦不对,我们不是大厂

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/1129060

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX