gorod使用指南一些经验和坑
go-rod 是基于 chrome devtools 协议的又一款 golang 驱动库。 目前 github 1.8k 个星星,比同行高出太多。
说一下使用经验: 要不要用Must*方法?
我觉得是不要用,比如: func doSth() { el0 := page.MustElementX("//p") ... el1 := page.MustElementX("//p") ... el2 := page.MustElementX("//p") } err = rod.Try(func () { doSth() }) if err != nil { seelog.Errorf("doSth failed: %v", err); }
如果你调用了 doSth() 方法,假设其中一个 MustElementX 出错了,比如超时,那你得到的错误信息仅仅是: doSth failed: context deadline exceeded
你永远不知道哪一步出错,只能每一步之前加个 debug log。 所以我通常都是用 ElementX : func doSth() { el0, err := page.ElementX("//p") if err != nil { seelog.Errorf("find el0 failed: %v", err) } ... el1, err := page.ElementX("//p") if err != nil { seelog.Errorf("find el1 failed: %v", err) } ... el2, err := page.ElementX("//p") if err != nil { seelog.Errorf("find el2 failed: %v", err) } }
看起来繁琐,但出错就会很容易调试。 如何避免卡住?
经常遇到这样的情况,页面加载出一部分,某个元素找不到、看不到、点不到,就会一直停在那里。 所以我的解决办法是加 Timeout: el, err := page.Timeout(timeout).ElementX("//p") err := el.Timeout(timeout).Click(proto.InputMouseButtonLeft)找到父元素后,如何查找/搜索它的子元素?
假设父元素 (FORM) 完整路径是: /html/body/form 子元素 (INPUT) 完整路径是: /html/body/form/p/input parent, err := page.ElementX("//form") inputEl, err := parent.ElementX("*//input")