pythonselenium实现gitlab全文搜索

　　一般来说软件开发相关企业都会有自己内部的源代码管理工具，比如私有部署的gitlab服务器。特别是企业上规模之后会有多个产品线，各个业务产品线各自的项目解决方案会非常多。
　　以我们公司为例，就招聘事业部来说，内部的大大小小的中台ESB、MRest、各种Consumer消费端、各种工具等等解决方案现在已经上百个了。这个时候你就会遇到如下一些场景：
　　1.需要修改某个公共接口的参数或者某个基础库项目包中的公共方法，但是不知道到底哪些项目、哪些地方引用了该接口，不好评估影响点？
　　2.业务代码中已知道某个Kafka Topic，但是当初写代码兄弟没备注消费端的项目，找了很久就是找不到Consumer项目在哪儿？
　　3.我想通过某一些特定的关键词搜索某一段代码，记不清到底在哪些项目中使用了？
　　如果你有上述的困惑，那么下面介绍的这个gitlab 全局 Search代码搜索工具能够帮你解决这些问题。工具的实现采用python + selenium + chromedriver实现自动化登录内部gitlab站点，通过勾选默认配置的产品分组，实现对多个分组内的项目代码特定多个关键词查询搜索。工具的运行流程及界面大概如下面几幅截图所示：
　　step1.读取配置文件信息自动登录：{   ＂username＂: ＂yourname＂,   ＂password＂: ＂yourpassword＂,   ＂projectGroups＂: [     ＂recrxxx＂,     ＂platform-uiframework＂,     ＂platform-infrastructure＂,     ＂ux-share-platform＂   ] }
　　step2: 登陆成功后主页注入搜索填充信息，可选择的搜索项目分组、关键词录入框等
　　step3:开始遍历项目分组，获取项目id，并执行关键词搜索
　　step4：获取命中结果展示，小于等于10个结果的会默认打开浏览器tab页全部展开，大于10个结果的需要手动打开单个或全部
　　step5:因为使用的chromedriver来驱动实现的，需要注意chrome浏览器版本与chromedriver版本的匹配，如不匹配会记录如下日志；
　　主要利用python 驱动 selenium 实现自动化控制gitlab项目页面，通过注入特定html标签代码，实现自动化搜索gitlab项目代码。下面是python脚本部分主要实现：class GitLabSearchTool(object):     def __init__(self):         self.__username = ＂＂         self.__password = ＂＂         self.projectGroups = []         self.usedKeywords = []         self.__getConfigInfo()         self.maxPageIndex = 50         self.pId = ＂spiderContainer＂         self.searchDivId = ＂searchContainer＂         self.base_url = ＂http://gitlab.xxxcorp.com＂         self.baseLoginUrl = ＂http://gitlab.xxxcorp.com/users/sign_in＂         self.startTime = datetime.now()         self.isSearching = False         self.stopSearch = False         self.isClose = False         self.successUrls = dict()         self.searchGroup = []         self.keywords = []         self.request = None         self.driver = None      def start(self):         user_agent = ＂Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36＂         chrome_options = Options()          chrome_options.add_argument(＂user-agent={}＂.format(user_agent))         chrome_options.add_argument(＂--disable-plugins＂)  # 禁用插件         chrome_options.add_argument(＂--start-maximized＂)  # 启动Google Chrome就最大化         chrome_options.add_experimental_option(＂excludeSwitches＂, [＂enable-automation＂])  # 隐藏＂Chrome正在受到自动软件的控制＂         pathItem = [＂chromedriver.exe＂]         driverPath = Path.cwd().joinpath(*pathItem)         self.driver = webdriver.Chrome(driverPath, options=chrome_options)          self.driver.get(self.baseLoginUrl)         if self.__username and self.__password:             WebDriverWait(self.driver, 1000).until(                 EC.presence_of_element_located((By.XPATH, ＂//*[@id=＂new_ldap_user＂]＂)))             time.sleep(0.3)             self.driver.find_element(By.XPATH, ＂//*[@id=＂username＂]＂).send_keys(self.__username)             time.sleep(0.3)             self.driver.find_element(By.XPATH, ＂//*[@id=＂password＂]＂).send_keys(self.__password)             time.sleep(0.3)             self.driver.find_element(By.XPATH, ＂//*[@id=＂remember_me＂]＂).click()             self.driver.find_element(By.XPATH, ＂//*[@id=＂new_ldap_user＂]/input[3]＂).click()         threading.Thread(target=self.__checkBrowserIsClose).start()         self.request = requests.session()         try:              while not self.isClose:                 try:                     homep = self.driver.find_element(By.ID, ＂xxxyoucangohomenow＂)                     if homep is not None:                         self.driver.get(self.base_url)                 except:                     pass                 try:                     searchDiv = self.driver.find_element(By.ID, ＂xxxyoucanstartsearchnow＂)                     if searchDiv is None:                         time.sleep(1)                     else:                         self.startTime = datetime.now()                         self.successUrls.clear()                         self.searchGroup.clear()                         self.keywords.clear()                         chkList = self.driver.find_elements(By.XPATH,                                                             ＂//*[@id=＂searchGroup＂]/descendant::input[@type=＂checkbox＂]＂)                         for chk in chkList:                             if chk.get_attribute(＂checked＂) == ＂true＂:                                 self.searchGroup.append(chk.get_attribute(＂attrvalue＂).strip())                         if len(self.searchGroup) <= 0:                             return                         keywordInput = self.driver.find_element(By.ID, ＂searchKeyword＂)                         searchKeyword = keywordInput.get_attribute(＂value＂).strip()                         keywords = re.split(＂,|，＂, searchKeyword)                         if len(keywords) > 0:                             for kw in keywords:                                 kw = kw.strip()                                 if len(kw) > 0:                                     self.keywords.append(kw)                         if len(self.keywords) <= 0:                             self.driver.execute_script(＂arguments[0].focus();＂, keywordInput)                             return                          self._search()                 except :                      time.sleep(1)             print(＂webdriver is close＂)             return         except Exception as ex:             print(＂异常：{}＂.format(ex))             return      def _search(self):         self.isSearching = True         self.stopSearch = False         for group in self.searchGroup:             if self.stopSearch:                 break             for page in range(1, self.maxPageIndex):                 if self.stopSearch:                     break                 url = ＂http://gitlab.xxxcorp.com/{}?page={}＂.format(group, page)                 self.driver.get(url)                 WebDriverWait(self.driver, 5).until(                     EC.presence_of_element_located((By.XPATH, ＂//*[@id=＂content-body＂]/p[2]/p[1]/ul/li[1]/a＂)))                 projects = self.driver.find_elements(By.XPATH,                                                      ＂//*[@id=＂projects＂]/p/ul/descendant::a[@class=＂project＂]＂)                 if len(projects) <= 0:                     break                 for proj in projects:                     try:                         stopSearch = self.driver.find_element(By.ID, ＂xxxyoucanstopsearchnow＂)                         if stopSearch is not None:                             self.stopSearch = True                             break                     except:                         pass                     projUrl = proj.get_attribute(＂href＂)                     self.__searchProject(projUrl)         endTime = datetime.now()           delta = (endTime - self.startTime).seconds            successCount = len(self.successUrls)         searchKeyword = ＂,＂.join(self.keywords)         if successCount > 0:             searchedPojectUrl = self.__getSearchedProject()             html = ＂＂＂                            查询{}
　　耗时：{} 秒! 命中{}个项目                                                                                       
　　{}                       ＂＂＂.format(searchKeyword, delta, successCount, searchedPojectUrl)         else:             html = ＂＂＂                            查询{}
　　耗时：{} 秒! 命中{}个项目                            
　　＂＂＂.format(searchKeyword, delta, successCount)         self.__createDom(html)         self.isSearching = False         if len(self.successUrls) <= 10:             for url, name in self.successUrls.items():                 self.driver.execute_script(＂window.open(＂{}＂)＂.format(url))     def __searchProject(self, projUrl):         proj = self.__getProjectId(projUrl)         if proj[0] <= 0:             return         for keyword in self.keywords:             if not (keyword and len(keyword.strip()) > 0):                 continue             searchUrl = ＂{}/search?utf8=&snippets=&scope=&search={}&project_id={}＂                  .format(self.base_url, keyword, proj[0])             data = self.request.get(searchUrl).text             html = etree.HTML(data)             topResults = html.xpath(＂//*[@id=＂content-body＂]/p[contains(@class,＂prepend-top-10＂)]＂)             if len(topResults) > 0:                 self.successUrls[searchUrl] = proj[1]                 # js = ＂window.open(＂{}＂)＂.format(searchUrl)                 # self.driver.execute_script(js)                 # self.driver.switch_to.window(self.driver.window_handles[0])             successCount = len(self.successUrls)             if successCount > 0:                 searchedPojectUrl = self.__getSearchedProject()                 html = ＂＂＂                            
　　正在查询＂{}＂
　　{}
　　查询命中{}个项目
　　{}                           ＂＂＂.format(keyword, projUrl, successCount, searchedPojectUrl)             else:                 html = ＂＂＂                            
　　正在查询＂{}＂
　　{}                           ＂＂＂.format(keyword, projUrl)             self.__createDom(html)      def __getProjectId(self, url):         proj_id = 0         proj_name = ＂＂         data = self.request.get(url).text         html = etree.HTML(data)         values = html.xpath(＂//*[@id=＂search_project_id＂]/@value＂)         if len(values) > 0:             proj_id = int(values[0])         names = html.xpath(＂//*[@id=＂search_project_id＂]/@data-name＂)         if len(names) > 0:             proj_name = names[0]         return (proj_id, proj_name)  .....

一味中药搭配煮水，堪称散结王者！消一身结节包块增生！大家好，我是李医生为什么很多人就是爱长结节的体质呢？还有包块增生肌瘤这些，在中医的角度认为呢，这些都是癥瘕zhengjia的范畴。调理上呢，一定要抓住这个病的核心，才能一举消散这些切磋技艺增进友谊怀化市乒协十一届乒乓球精英赛在沅陵举行华声在线3月27日讯（通讯员瞿云李捷）3月26日，为期3天的怀化市乒协十一届乒乓球精英赛在沅陵降下帷幕。溆浦县乒协鹤城区乒协沅陵县乒协会同县乒协代表队分别夺得混合团体甲组前4名，鹤6686英超，水晶宫迎战莱斯特城实力分析0比1莱斯特城胜6686英超，水晶宫迎战莱斯特城实力分析0比1莱斯特城胜水晶宫和莱斯特城是英超联赛中的两支实力不俗的球队，他们在本场比赛中将进行一番激烈的角逐。首先来看水晶宫。这支球队在过去几个赛你认为中国男足的底线在哪？输赢都无所谓，因为他们都不差钱。底裤都没了要什么底线谢谢邀请回答！我个人认为中国球员的体质和技巧灵活性没有达到足球所需要的基本要求！中国足球缺的不是人才，也不是钱，是制度，是管理，为什么朱婷的关键球很可怕？朱婷现在已经成为世界第一主攻，这个称号可是靠实实在在的实力打出来的，已经得到全世界的公认。朱婷作为世界第一主攻，她的实力非常全面，是中国女排的定海神针，是中国女排获胜的最大保障。朱国足为什么一直很菜呢？国足，这么多年，越来越差的原因，我分析如下1。选拔球员，猜测并非按水平公正选拔的，很多都是关系户吧？2。球员的管理问题，纪律问题3。心态问题，感觉扭曲了，一切向钱看，导致没有国家荣家里装中央空调，现在对于三菱电机和大金纠结，到底是选哪个？去年装修了两套房，三菱电机和大金都看了，我家最后选的三菱电机，给岳母那选的大金。其实两个品牌都不错，具体选择还要根据家里的使用情况。以我家为例，普通的三居室，因为开发商室外机空间设糖尿病不花钱降血糖，这个方法每天30分钟，血糖越来越好事实证明，运动是最省事最有效，而且是事半功倍的降血糖救去，科学合理的运动，不但可以降低血糖血脂，有利于糖尿病的控制还能有效预防或延缓糖尿病的各种并发症。每天30分钟走路是一种简单而一个方子，上补心肺，中补脾胃，下补肝肾，建议收藏今天给大家分享一个古方，现在也有的中成药，就是三精丸，出自于道家，后又被医学入门录入，方子非常简单，只有三味药，三这个数字意思又泛指多数，也就是道家说的三生万物，久服延年身轻，面如慎吃！嗓子疼吃喉糖，小心这些副作用！身边很多人在感染甲流以后都会嗓子疼。而且现在正是春夏交接，很多人在日常生活中也会有嗓子疼的情况。有了这种情况很多人会选择吃喉糖，喉糖到底管不管用呢？要如何做才能缓解嗓子吞刀片的症状喝醋可以软化血管？专家错！当心腐蚀消化道！这4个软化血管的传言到底有没有真的？特邀心血管内科的医生守护你的健康你在生活中听过或使用过哪些偏方或小妙招这些都是靠谱的吗？关于软化血管的4大谣言你都做过吗？01hr喝醋可以软化血管？02hr喝红酒可以软化血管？03

<<<<<<－>>>>>>

欣旺达千亿投资狂奔锂电赛道汽车电池子公司分拆上市加速21世纪经济报道记者张望报道被称为动力电池黑马的欣旺达（300207。SZ），又有大动作。根据9月21日公告，欣旺达子公司欣旺达汽车电池将在义乌市投资建设新能源动力电池生产基地项目北电通报赵韦弦被刑拘将依法依规严肃处理青春北影微信公众号消息，北京电影学院学工部发布公告称，学校将按照程序依法依规严肃处理。此前报道北电学生被曝下载200多人私密照警方其已被刑拘针对网传某高校学生赵某某（男，20岁）违英女王刚去世，儿子儿媳齐作妖，王室斗起来了？前几天，英女王伊丽莎白二世去世，终年96岁。一代传奇就此落下帷幕。生前，她从不避讳死亡，甚至可以说是乐观接受。乐观到什么程度呢？她早就让英国王室多次彩排过自己的葬礼，每次都旁观彩排cf手游零水下丽影获取全解在cf手游当中零水下丽影是最近上线的全新角色，玩家只能通过零水下丽影挑战卡才能获取。想必很多玩家还不清楚，零水下丽影怎么获得。一起来看看吧。cf手游零水下丽影获取方法1与常规角色的eStar真的没人管得住，第一个4连冠队伍要诞生，刺痛也直呼离谱在本赛季，也就是2022年的夏季赛来讲，eStar继续保持了大魔王的统治能力，让不少观众们都为之震撼，就在夏季赛季后赛胜者组决赛当中，eStar再一次碰到了重庆狼队，并且以41的战LPL赛区S12冒泡赛形势RNG两条命，LNG与V5只有一次机会北京时间8月26日，LPL夏季赛季后赛上JDG让二追三战胜TES，JDG成功晋级LPL夏季赛总决赛，TES掉入败者组将于EDG争夺最后一个决赛席位。目前LPL赛区的冒泡赛形势，虽然戴尔孙兴慜以帽子戏法找回状态，这是我们全队需要的直播吧9月21日讯在接受采访时，热刺后卫戴尔谈到了球队攻击手孙兴慜此前的进球荒，他表示，球队一直都支持孙兴慜。戴尔这样谈道我不喜欢某个人的状态影响到他们本身，这是不同的事情。如果你变（小小说）1975年，市里来公社招工，公社分给大队一个名额。全大队千把号人，就这一个名额，到底让谁去呢？那时，农村生活还很困难，人们都巴望着跳出农门，到城里当工人。那样的话，一个人的一生就会现在开一家成人用品店容易吗？现在在中国其实还是有很多人都对性这个方面本能地害羞，不想不敢多人谈及。但是电商的兴起，网购是一个能够很好地保护用户消费隐私途径，客户对购买成人用品的隐私保护要求很高。然而，随着电商降低准入门槛，体验极狐阿尔法S525S前不久，极狐正式上市了新款阿尔法S，主要是对配置和价格进行了调整，特别是入门版的车型相比老款价格下调了2。35万元。而这样的价格调整，也让它在面对当下火热特斯拉小鹏P7以及比亚迪海北电女生实名举报导演赵韦弦曝光性丑闻细节本人已退学发文报平安北电女生实名举报导演赵韦弦曝光X丑闻细节本人已退学发文报平安时至今日，我们不得不报道这个事件，这阵子娱乐圈关于艺考圈内的那些事，前面有北电导演赵韦弦诱骗女学生，后有艺考机构老师杜英