范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

文本分析(课题研究常用方法)

  文本分析(课题研究常用方法)
  awk是流式编辑器,针对文档中的行来操作,一行一行地执行。awk可以非常方便、高效地操作文档以及字符,从而实现我们想要的格式。它的功能非常强大,我在 shell 脚本中经常使用它来处理字符串。下面介绍几个在工作中使用awk较频繁的用法。
  1. 截取文档中的某个段
  示例命令如下:#head-n2test.txt|awk-F':''{print$1}'root  bin
  本例中,-F选项的作用是指定分隔符。如果不加-F选项,则以空格或者tab为分隔符。print为打印的动作,用来打印某个字段。$1为第 1 个字段,$2为第 2 个字段,以此类推。但$0比较特殊,它表示整行:#head-n2test.txt|awk-F':''{print$0}'root:x:0:0:root:/root:/bin/bashbin:x:1:1:bin:/bin:/sbin/nologin
  注意awk的格式,-F后面紧跟单引号,单引号里面为分隔符。print的动作要用{}括起来,否则会报错。print还可以打印自定义的内容,但是自定义的内容要用双引号括起来,如下所示:#head-n2test.txt|awk-F':''{print$1"#"$2"#"$3"#"$4}'root#x#0#0bin#x#1#1
  2. 匹配字符或者字符串
  在文档中过滤出包含指定字符串的行,示例命令如下:#awk'/oo/'test.txtroot:x:0:0:root:/root:/bin/bashlp:x:4:7:lp:/var/spool/lpd:/sbin/nologinmail:x:8:12:mail:/var/spool/mail:/sbin/nologinoperator:x:11:0perator:/root:/sbin/nologinpostfix:x:89:89::/var/spool/postfix:/sbin/nologinsetroubleshoot:x:992:990::/var/lib/setroubleshoot:/sbin/nologin
  这跟sed的用法类似,能实现grep的功能,但没有颜色显示,肯定没有grep用起来方便。不过awk还有比sed更强大的匹配,如下所示:#awk-F':''$1~/oo/'test.txtroot:x:0:0:root:/root:/bin/bashsetroubleshoot:x:992:990::/var/lib/setroubleshoot:/sbin/nologin
  它可以让某个段去匹配,这里的~就是匹配的意思。
  此外,awk还可以多次匹配,如下所示:#awk-F':''/root/{print$1,$3}/test/{print$1,$3}'test.txtroot0operator11test1006
  本例中,awk匹配完root,再匹配test,并且只打印所匹配的段。
  3. 条件操作符
  有时候,在匹配字符的同时要给出限定条件,比如第 3 段为0。示例命令如下:#awk-F':''$3=="0"'/etc/passwdroot:x:0:0:root:/root:/bin/bash
  在awk中,我们可以用逻辑符号进行判断,比如==就是等于,也可以理解为精确匹配。另外,还有>、>=、、!=等。值得注意的是,在和数字比较时,若把要比较的数字用双引号引起来,那么 awk 不会将其认为是数字,而会认为是字符,不加双引号就会认为是数字。示例命令如下:#awk-F':''$3>="500"'/etc/passwd|head-n5shutdown:x:6:0:shutdown:/sbin:/sbin/shutdownhalt:x:7:0:halt:/sbin:/sbin/haltmail:x:8:12:mail:/var/spool/mail:/sbin/nologinnobody:x:65534:65534:KernelOverflowUser:/:/sbin/nologindbus:x:81:81:Systemmessagebus:/:/sbin/nologin
  本例中,阿铭本想把 uid 大于等于 500 的行打印出来,但是结果并不理想。这是因为awk把所有的数字都当作字符了,就跟上一章中提到的sort排序原理一样。但是,如果不加双引号,就得到了想要的结果:#awk-F':''$3>=500'/etc/passwd|head-n5nobody:x:65534:65534:KernelOverflowUser:/:/sbin/nologinsystemd-coredump:x:999:997:systemdCoreDumper:/:/sbin/nologinpolkitd:x:998:996:Userforpolkitd:/:/sbin/nologingeoclue:x:997:995:Userforgeoclue:/var/lib/geoclue:/sbin/nologinunbound:x:996:991:UnboundDNSresolver:/etc/unbound:/sbin/nologin#awk-F':''$7!="/sbin/nologin"'/etc/passwdroot:x:0:0:root:/root:/bin/bashsync:x:5:0:sync:/sbin:/bin/syncshutdown:x:6:0:shutdown:/sbin:/sbin/shutdownhalt:x:7:0:halt:/sbin:/sbin/haltaminglinux:x:1000:1000:aminglinux:/home/aminglinux:/bin/bash
  上例中,!=表示不匹配,它除了针对某一个段的字符进行逻辑比较外,还可以在两个段之间进行逻辑比较。如下所示:#awk-F':''$3
  另外,还可以使用&&和||,它们分别表示"并且"和"或者"。&&的用法如下:#awk-F':''$3>"5"&&$3
  ||的用法如下:#awk-F':''$3>1000||$7=="/bin/bash"'/etc/passwdroot:x:0:0:root:/root:/bin/bashnobody:x:65534:65534:KernelOverflowUser:/:/sbin/nologinaminglinux:x:1000:1000:aminglinux:/home/aminglinux:/bin/bash
  4. awk 的内置变量
  awk常用的变量有OFS、NF和NR。OFS和-F选项有类似的功能,也是用来定义分隔符的,但是它是在输出的时候定义的。NF表示用分隔符分隔后一共有多少段。NR表示行号。
  OFS的用法示例如下:#head-5/etc/passwd|awk-F':''{OFS="#"}{print$1,$3,$4}'root#0#0bin#1#1daemon#2#2adm#3#4lp#4#7
  还有更高级一些的用法:#awk-F':''{OFS="#"}{if($3>=1000){print$1,$2,$3,$4}}'/etc/passwdnobody#x#65534#65534aminglinux#x#1000#1000
  变量NF的具体用法如下:#head-n3/etc/passwd|awk-F':''{printNF}'777#head-n3/etc/passwd|awk-F':''{print$NF}'/bin/bash  /sbin/nologin  /sbin/nologin
  这里NF是多少段,$NF是最后一段的值。变量NR的具体用法如下:#head-n3/etc/passwd|awk-F':''{printNR}'123
  我们还可以使用NR作为判断条件,如下所示:#awk'NR>40'/etc/passwdinsights:x:978:976:RedHatInsights:/var/lib/insights:/sbin/nologinsshd:x:74:74rivilege-separatedSSH:/var/empty/sshd:/sbin/nologinavahi:x:70:70:AvahimDNS/DNS-SDStack:/var/run/avahi-daemon:/sbin/nologintcpdump:x:72:72::/:/sbin/nologinaminglinux:x:1000:1000:aminglinux:/home/aminglinux:/bin/bash
  NR也可以配合段匹配一起使用,如下所示:#awk-F':''NR
  5. awk 中的数学运算
  awk可以更改段值,示例命令如下:#head-n3/etc/passwd|awk-F':''$1="root"'rootx00root/root/bin/bashrootx11bin/bin/sbin/nologinrootx22daemon/sbin/sbin/nologin
  awk也可以对各个段的值进行数学运算,示例命令如下:#head-n2/etc/passwdroot:x:0:0:root:/root:/bin/bashbin:x:1:1:bin:/bin:/sbin/nologin#head-n2/etc/passwd|awk-F':''{$7=$3+$4}'#head-n2/etc/passwd|awk-F':''{$7=$3+$4;print$0}'rootx00root/root0binx11bin/bin2
  awk还可以计算某个段的总和,示例命令如下:#awk-F':''{(tot=tot+$3)};END{printtot}'/etc/passwd84699
  这里的END是awk特有的语法,表示所有的行都已经执行。如下所示:#awk-F':''{if($1=="root"){print$0}}'/etc/passwdroot:x:0:0:root:/root:/bin/bash
  其实awk可以写成一个脚本文件,而且有它特有的语法。在awk中使用if判断、for循环都可以,只是在日常管理工作中,使用那么复杂的语句并不常见。
  最后,我们再附上常见正则字符的解释。
  .表示任意一个字符,比如空格、特殊符号等。
  *表示*前面的字符有 0 个或多个,比如a*那就是 0 个a或者多个a。
  .*表示任意个任意字符,就是贪婪匹配了。
  +就是+前面的字符有 1 个或者多个,如a+就是a、aa、aaa……
  ?就是?前面的字符有 1 个或者 0 个。
  { }里面是一个范围,如{1,5}就是{ }前面的字符有 1~5 个。
  |表示或者,如a|b就是a或者b。
  表示这里面的任意一个字符,如[abc]就是a或者b或者c。此外,也可以用范围[0-9]表示任意一个数字,用[a-z]表示任意一个小写字母。

手捻葫芦(手捻葫芦精品)手捻葫芦(手捻葫芦精品)又到了一年中葫芦收获的季节。在花鸟市场卖文玩葫芦的也多了起来,大大小小造型各异的葫芦俨然已成一景。喜好的人都知道,葫芦越小越值钱,长度不到3厘米的葫芦就能卖沁园怎么样(沁园哪个系列净水器好)2020净水器哪个牌子好?近几年,工厂排污水源地死猪等各种水污染问题频现报端,另外自来水管道老化细菌滋生山寨桶装水盛行,也让人们防不胜防。为了保障家庭饮用水安全,在家里安装一台净水怎么映射端口(网络端口映射如何做)以下讲解几款市面主流品牌路由器的端口映射1)Tplink路由器(以TplinkR460为例)内网IP192。168。1。101是WEB服务器,TPLINK系列路由器的默认管理地址为怎么练声音(怎么练就一副好嗓音)练习曲的练习,是发声歌唱的重要的基础训练。发声练习过程中,是以声音效果和发声器官肌肉适度的标准去调整发声器官的机能和状态的,每个人的发声器官的构造嗓音条件声音类型发声习惯各不相同,怎么隐藏路由器(手机怎么连接隐藏的wifi)为加强网络安全,本期特别推出家用无线网络修改密码及隐藏设置操作说明。1连接。将无线路由器接通电源,并将电脑出来的网线接到任意LAN口上。2设置本机IP地址。把电脑ip地址设置为自动招聘怎么招(代招公司怎么招人的)前段时间下班跟公司HR小姐姐闲聊,小姐姐感慨现在招人是越来越难了。当时很纳闷,只听说过工作越来越难找了,可没听说过公司招人越来越难了啊!于是我们围绕究竟是找工作难还是招人难展开了深右侧腰疼怎么回事(肾从背后看在哪个位置图)一首先我们要区分肾痛和腰痛的区别。1用手揉一揉腰部的肌肉,如果是腰部损伤的人就会感觉舒服一些,这就是腰部损伤,否则就是肾疼。2可以用手握拳敲击腰部,如果是肾脏疼痛的人会有感觉。二对火山怎么打(火山最后一个图怎么打)文飞梦本期分享迷你世界1。0版本更新一个星期了,其中最让玩家喜爱的就是火山地图,但是想要征服火山地图太难了,不仅有滚烫的岩浆,还有终极虚空幻影BOSS把守火山,不过想要成功征服火山BIOSTAR推出B550MSilver主机板BIOSTAR今天推出採用AMDB550晶片的B550MSilver主机板。除了支援Ryzen4000ldquoRenoirrdquo和Ryzen3000ldquoMatisser如何投资电影送你的一朵小红花?投资成本多少?投资优势真实吗?投资小贴士无论投资渠道合法还是正规,资金保障是第一步,项目的投资风险和投资收益是第二步。根据电影制片人的规定,禁止以推广的形式披露电影成本和电影份额的启动投资。因此,如果您有意认购WD18TBCMR硬碟Q2量产20TB将开始大量应用SMRWD上週末宣布更换CEO,SteveMilligan去年10月份就宣布要退休了,3月9日起Cisco网路安全业务副总DavidGoeckeler将担任CEO一职,带领WD继续前进。
今日废铜价上涨原因废铜价格今日价格多少钱一吨不保证该信息的准确性真实性完整性有效性及时性,今年10月19日废铜回收价格调整信息,今年7月6日,破碎紫铜元吨。粗缆8股线5吨以上单价高200元。台州市场废铜价格行情月12日Mys只有手机号码如何查通话记录(手机号码查询通话清单)92只有手机号码如何查通话记录(手机号码查询通话清单)序言说句实话,我身边很多有对象的人大多数都有一个惯性,那就是特别爱检查对象的手机,特别是微信,有的甚至检查到了痴狂的地步。为何用痴为什么眼里常含泪水(为何你的眼里常含泪水神回复)来源海外网为什么我的眼里常含泪水?因为我对这土地爱得深沉。这句话生动地反映了青年的家国情怀。随着被称为网生一代的当代青年逐渐走入社会,人们开始,现在的年轻人是否比他们的父辈更爱国?查老婆和别人的微信聊天记录(偷看老婆和她同事聊天记录)子木梅子木梅我已经39岁了,却发现自己活在笑话里。26岁那年,我和前妻相亲认识,结婚了。说实话,前妻不是我喜欢的类型。只是,到了适婚年龄,我们相亲认识。说实话,在和前妻生活的九年里果园有哪些(果园的四季)江苏省位于我国东部沿海中心,是长江三角洲地区的重要组成部分,气候温和,四季分明,雨量适中,适宜果树生产。近年来,随着农业产业结构的全面调整,园艺产业因优质高产高效成为农村经济发展中重庆弹子石(重庆弹子石一日游)重庆弹子石(重庆弹子石一日游)弹子石介绍弹子石老街,位于重庆市南岸区泰昌路68号,曾是西南地区著名的水陆埠口,拥有法国水师兵营王家大院等开埠文化根脉。一街两埠四院十景构成了弹子石老风和日丽演员表(风和日丽这五个人物角色)风和日丽演员表(风和日丽这五个人物角色)电视剧风和日丽是杨文军导演拍摄的一部女性情感剧。主要讲述杨小翼(马伊琍饰)为了寻找自己亲生父亲的经历,及她个人的爱情故事。这部剧里的人物角色康熙传位之谜(解密康熙传位之谜)康熙传位之谜(解密康熙传位之谜)从承继大统到猝然离世,雍正13年的帝王生计由生到死满是谜,好像他的每一步都有如影随形的污点,以至于正本的康雍乾盛世竟被戴有色眼镜看人的后世史学家硬给库丘林为什么叫大狗(库丘林原型)FATE中大狗库丘林作为枪兵职阶参与第五次圣杯战争,而他的原型其实是凯尔特神话当中北爱尔兰的光之子,而更有趣的是大狗其实和吾王都是同属于凯尔特神话里面的英雄,只是当中亚瑟王和圆桌骑杨幂收图收到没内存近日杨幂收图收到没内存登录了热搜,也是在网上引起了网友们的关注,那么很多小伙伴可能还不清楚具体的情况如何,小编也是在网上查阅了一些信息,那么接下来就分享给大家来了解下杨幂收图收到没吴倩莲电影(吴倩莲林忆莲)吴倩莲电影(吴倩莲林忆莲)1988年香港电影实行分级制度的,电检开始宽松,由此导致大量充斥着不良画面的影片泛滥成灾。但是,香港电影人也因此获得了更为广阔的创作空间,拍出了很多突破题