每日分享最新,最流行的软件开发知识与最新行业趋势,希望大家能够一键三连,多多支持,跪求关注,点赞,留言。我们分析了超过50亿个GitHub事件,并发现了有关开源软件的有趣发现,包括顶级编程语言、地理分布行为、热门话题以及最活跃的存储库和开发人员。 我们分析了超过5,000,000,000行的GitHub事件数据,并在这里得到了结果。在本报告中,您将在2022年获得有关GitHub上开源软件的有趣发现。过去四年开源世界的顶级语言 该图表根据使用这些语言的新存储库与所有新存储库的比率,每年对2019年至2022年的编程语言进行排名。顶级编程语言 见解:Python超越Java并在2021年升至第3位。TypeScript从10上升到6,SCSS从39上升到19。SCSS的兴起表明,重视前端表现力的开源项目正在逐渐普及。多年来,Ruby和R这两种语言的排名下降了很多。后端编程语言排名 拉取请求中使用的编程语言反映了开发人员使用的语言。为了找出最流行的后端编程语言,我们通过新的拉取请求查询了2019年至2022年编程语言的分布情况,并且每年都进入前10名。顶级后端编程语言 图表数据表明:Python和Java分别排名第一和第二。2021年,Go超越Ruby,在2021年排名第三。Rust多年来一直呈上升趋势,在2022年排名第9。开发者行为的地理分布 我们查询了2022年1月1日至9月30日全球发生的各种事件的数量,并根据这些国家地区的开发者触发的事件数量确定了前10个国家。该图表按国家或地区显示每种事件类型的比例。开发者行为的地理分布 图表显示:前10个国家触发的事件约占所有GitHub事件的23。27。然而,来自这些国家的开发者数量只有10。美国开发人员最有可能审查代码,PullRequestReviewEvent份额为6。15。韩国开发人员更喜欢直接推送到存储库(PushEvent)。日本开发人员最有可能通过拉取请求提交代码,PullRequestEvent份额为10。德国开发者喜欢打开问题和评论,IssueEvent和CommentEvent分别占4。18和12。66。中国开发者喜欢给仓库加星,WatchEvent占17。23,ForkEvent占2。7。 笔记:2022年有17,062,081个开发者有行为事件,其中有2,923,523个有Location字段,所以抽样率为17。13。GitHub识别出15种类型的事件。我们只展示常用的类型。评论事件包括CommitCommentEvent、IssueCommentEvent和PullRequestReviewCommentEvent。其他包括MemberEvent、CreateEvent、ReleaseEvent、GollumEvent和PublicEvent。平日和周末的开发者行为分布 我们查询了每周7天中每种事件类型的分布情况。工作日和周末的开发者行为分布 见解:开发者在工作日最为活跃,有77。73的事件发生在工作日。特定事件的分布周一至周日的开发者行为分布 见解:PullRequestEvent、PullRequestReviewEvent和IssuesEvent在星期二的百分比最高,而在周末的百分比最低。PushEvent、WatchEvent和ForkEvent活动在工作日和周末的数量相似,而PullRequestReviewEvent的差异最大。WatchEvent和ForkEvent更多的是个人行为,PullRequestReviewEvents更多的是工作行为,PushEvents更多是在个人项目中使用。流行的开源主题 每年,技术都会引入新的流行语。我们能否通过热词背后的开源存储库洞察技术趋势?我们调查了五个技术领域:低代码、Web3、GitHubActions、数据库和人工智能。热门话题的活跃度 我们查询了与每个技术领域相关的开源存储库的数量,以及2022年活跃存储库的百分比。热门话题的活跃度 该图显示低代码主题中的开源存储库最活跃,2022年活跃率为76。3,其次是Web3,为63。85。历年热门话题 从2015年到2022年,我们对每个技术领域进行了如下查询:存储库的年增量合作活动年增量参与协作活动的开发者数量恒星年增量 然后,我们计算了每年的增长率,它可以反映新进入者、开发者在该技术领域的参与度以及行业对该领域的兴趣。对于2022年,我们将其前9个月与2021年的前9个月进行了比较。低代码存储库 我们可以看到,2020年是项目开发的高峰期,新增仓库增加了313。43,开发者协作事件增加了157。06。行业兴趣在2021年增长最为显着,达到184。82。2022年同比增长数据显示,新存储库数量减少(26。21),但开发者参与度和行业兴趣仍在上升。2022年时间范围:01。0109。30,不包括机器人事件和分叉存储库Web3存储库 无论是创建新的仓库、开发者,还是业界的兴趣,Web3生态近年来发展迅速,2021年新仓库增长率达到322。65的峰值。 2022年时间范围:01。0109。30,不包括机器人事件和分叉存储库GitHub操作存储库 GitHubActions存储库的年增长率一直在下降,但开发人员的参与度和行业的兴趣仍在小幅增长。 2022年时间范围:01。0109。30,不包括机器人事件和分叉存储库数据库存储库 作为基础设施项目,Database项目的门槛很高。与其他领域的项目相比,数据库项目具有稳定的增长速度。 2022年时间范围:01。0109。30,不包括机器人事件和分叉存储库人工智能存储库 经过2016年和2017年两年的高速增长,人工智能领域的开源项目逐渐增长缓慢。 2022年时间范围:01。0109。30,不包括机器人事件和分叉存储库2022年最受欢迎的存储库 星星的数量是开源项目受欢迎程度最明显的标志。我们查看了2022年1月1日至9月30日期间获得最多星级的50个项目。我们发现:2022年最受欢迎的存储库 时间范围:2022。01。012022。09。30,不包括机器人事件过去四年最活跃的存储库 在这里,我们查找了从2019年到2022年每年排名前20的活跃存储库,并计算了每个存储库的列表总数。存储库的活动根据参与协作事件的开发人员数量进行排名。存储库名称数数微软vscode4颤动颤动4MicrosoftDocs天蓝色文档4首次贡献首次贡献4Facebook反应原生4火炬火炬4微软打字稿4张量流张量流3kuberneteskubernetes3绝对类型绝对类型3成长到3googleitcertautomationpractice3家庭助理核心3微软PowerToys3微软WSL3 见解: 微软拥有列表中最多的存储库,有五个。 tensorflowtensorflow和kuberneteskubernetes在连续三年(2019年到2021年)上榜后均跌出前20。 2022年名单的新成员是archwaynetworktestnets、elementfielfcouncilfrontend、solanalabstokenlist、educationGitHubGraduation2022、taozhiyuTyProAction、NixOSnixpkgs、rustlangrust。 时间范围:2022。01。012022。09。30,不包括bot事件2022年谁给的星星最多 我们查询了2022年打星最多的开发者,获得了前20名,并过滤掉了疑似机器人的账号。如果开发人员的星事件数除以已加星的存储库数等于或大于2,我们怀疑此用户是机器人。给予最多星星的开发者 我们发现,截至2022年9月30日,加星库最多的开发者共加星库37,228个,平均每天136个。 时间范围:2022。01。012022。09。30,不包括机器人事件自2011年以来最活跃的开发者 自2011年以来,我们每年查询前20名最活跃的开发人员。这次我们没有过滤掉机器人事件。最活跃的开发者 我们发现机器人的百分比越来越大。机器人从2013年开始超越人类,到2022年达到95以上。附录术语说明GitHub事件:GitHub事件由用户操作触发,例如为存储库加注星标或推送代码。时间范围:本报告中2022年的数据采集范围为2022年1月1日至2022年9月30日。2022年与另一年的数据比较时,我们采用同比分析。机器人事件:机器人触发的事件在GitHub事件中所占的比例越来越大。然而,这些事件并不是本报告的重点。我们通过匹配正则表达式过滤掉了大部分由机器人发起的事件。我们如何按主题对技术领域进行分类 我们根据存储库主题进行精确匹配和模糊匹配。精确匹配意味着存储库主题有一个与该词完全匹配的主题,而模糊匹配意味着存储库主题有一个包含该词的主题。