范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

能否把1GB的数据压缩到1MB甚至更小的体积?

  1GB的数据确实可以压缩到比1MB更小的体积。
  比如1.56GB的数字"1",如果用txt文本的形式表示出来就会出现满大屏的"1",但压缩过后的压缩文件可以描述为:1.txt里有多少个"1",解压缩可以新建一个名为1.txt的文件,然后往里面写入相应数量的"1"。"1.txt里有多少个1"只会占用磁盘的几KB的空间,而1.txt里真的写入这么多个"1"后,就会占用1.56GB的磁盘空间。
  但是如果生成一个随机字符组成的.txt文件,不管用任何压缩软件都很难压缩得动。
  压缩软件压缩文件其实就是在找规律,利用数据的一致性和可预测性去实现压缩的目的。一般来说可以用比较精确的自然语言来描述一样事物,那么就越能够对这样事物做压缩。写出1万个"1"和说1个万"1"实际意义不一样,但所表达的意思是一样的。
  由此可见压缩后的文件大小是由文件本身的属性和压缩算法共同决定。
  如果在一只注射器里装满空气,然后堵住出口,适应按压注射器推进装置可以将空气压缩到很小很小的的体积,当压力释放的时候注射器的橡皮阀也会回退到原来的位置。如果往注射器里装满水,堵住出口后,用力按压注射器推进装置里面的水几乎体积不变。通过这个小实验我们就能很好地理解文件本身的属性到底是个什么东西,它决定了数据可压缩的程度。
  为什么说算法也决定了文件的压缩大小呢?
  算法所带来的实际效果是颠覆性的,比如算从1到100的和,从1一直加到100既费纸又费时间,还很可能中途会算错。如果找到规律仅仅只需要头数+尾数的和再乘以末尾数的一半,几秒钟就可以心算出答案。
  当然算法的绝对优势建立在数据的规律性之上,而文件压缩同样是建立在数据的规律性进行压缩。但话又说回来压缩率高并不代表就一定好。如下图,从1~100的数,我们可以通过不同的程序算法将它输出到屏幕上显示出来。将1、2、3、4、5、6、7、8、9……95、96、97、98、99、100直接输入到程序中,然后通过程序直接输出到屏幕上。定义一个变量i,i初始值为1,输出到屏幕上后i+1,然后再输出。重复99次,就将从1~100的数全部输出到屏幕上了。定义一个数组,初始值为{1,2,3,4,5,6,7,8,9,10},输出到屏幕上,再定义一个数组,值为第一个数组里的数加10,输出到屏幕上。重复9次,就将从1~100的数全部输出到屏幕上了。
  算法一因为要花很多的时间将全部要显示的数都写进程序内,所以程序本身所占的存储空间是非常大的,这也意味着打开它很吃内存。算法二写出来的程序所占用的存储空间是最小的,但它需要CPU的计算量是最大的。算法三对算法一、算法二的优点、缺点进行了折中,在程序不占用过多存储空间的前提下,也让CPU计算量减少。这就可以充分地解释为什么有的压缩解压软件压缩率很高但很耗时间、很耗CPU和内存;有的压缩解压软件压缩率压缩率一般但很快能压缩、解压。每次压缩、解压都很快的软件是不存在的,因为并不是每一个文件都会遵循程序设定好的套路走。有损压缩也是我们常会用到的一种压缩形式
  有损压缩顾名思义就是会裁掉一些我们用不到的数据,仅保留我们需要的数据。比如下图的美女图片,将颜色和细节信息删除掉仅仅保留线图我们还是可以认出她是一位美女。通过有损压缩的方式是完全可以将1GB的文件压缩1MB或者更小。当然有损压缩是具有破坏性的,压缩后的数据是没有办法恢复到压缩前。
  但有损压缩却是我们经常会用到的,比如图片压缩、音频压缩、视频压缩,人们看图或者显示画面的时候并不会主要到一些细节并不完善,同样即使两个音频录音采样序列可能听起来一样,但实际上并不完全一样。
  文档压缩解压离我们渐行渐远
  在过去网速慢而且贵的情况下,充分的体现了压缩解压的优势所在。如今网速飞快、每GB存储空间白菜价的年代能用到压缩解压的人越来越少。在软件、硬件都不断升级的前提下,人们也更加倾向于欣赏无损的图片、音频、视频。
  其实压缩的技术用途还是非常广泛,比如现代通信,只有当信息的发送方和接受方都能理解编码机制的时候压缩数据通信才能工作。
  以上个人浅见,欢迎批评指正。
  认同我的看法,请点个赞再走,感谢!
  喜欢我的,请关注我,再次感谢!
  这个真的是可以的,只是一种可行的方法,没有现成的技术,把记录信息的二进制码转换成为10进制,然后把小数点移动到最前面,这样会得到一个小于1且非常长的小数,理论上可以用两个较短的数字做除法得出前面要表示的10进制特长小数,可以用剩余的空间记录计算方法,有限位,编码形式等数据。只是这样会特别考验电脑的计算能力,尤其是加密的时候计算量会特别大,现阶段电脑无法完成这样的任务,相信以后会的…[呲牙][呲牙][呲牙]
  得看你的数据内容啦,如果全都为0x00 ,那就好办啦!不过楼主肯定不是说这种数据,我觉得网上的一部1G大的视频,可是可以压缩,但是是有损的,且压缩后不可逆,以目前的技术来说很难实现吧!
  你没明白压缩是什么意思吗?"1111111111"占用十个位置我用"10个1"表示就是 四个位置  就压缩了一半多。你1G的压缩成1M的 是压缩了1024倍,除非这1G是无意义的重复数据。压缩率涉及到压缩算法比较复杂,但基本的原理你得知道,不是说像个棉花一样物理上压实。
  数据压缩不是万吨水压机!
  数据压缩的机制是数据里有重复,可以重新编排,节省空间。或用规律表征数据。
  比如五星红旗,大面积红色,就可以用  (100,255)表示随后有100个255色号的点,数据从100个字节缩小为2个字节。
  一般BMP格式图片压缩成JPG压缩率10-25%。
  矢量字库就比点阵字库占用空间小得多。
  并不是所有文件都可以压缩!压缩算法也有极限,即便是有损压缩也有可接受程度。
  你说1G数据能不能压缩成1M,不抬杠,是完全可能的!一幅画面巨大的五星红旗或夜空中的 …
  曾经看过一篇科幻小说,一根水晶柱,刻一道印迹就能把全世界数据都包含了。方法是总长和印迹位置比值无限细分,只要有足够的分辨能力,巨量数据就可以存储识别。理论上可行!
  一串数压缩极限就是a/b,寻找合适的a和b就是压缩算法的终极目标。
  压缩方法楼主自己已经把答案说出来了啊:1GB的数据
  虽然听起来是玩笑一样的答案,但事实上已经涵盖了压缩方法的核心要点。
  压缩分为无损压缩和有损压缩,区别在于无损压缩可以根据压缩的结果逆向推导出完整的原数据,而有损的只能还原部分。
  无损压缩的核心是根据数据的规律用简化的方式表达,比如0000000000可以表达为10个0,反过来当你拿到10个0这样的压缩后数据时,可以还原成0000000000。举个例子,一张256*256像素的纯黑图片,其对应的原始数据就是256*256、rgb均为0的一个文件,而理论上,你也可以用以上表述作为这张图片的压缩结果。
  而有损压缩则会丢失部分数据的内容。说回一开始的调侃,题主所说的1GB的数据可能是一个游戏、一部电影或者一张图片,但是用题主的压缩方式,只保留了数据大小这一信息,其他信息均被丢失,但也成功的将数据进行了大幅压缩。举个现实一点的例子,一张256*256的,每行像素都是从rgb均为0递增到rgb均为255的灰度渐变图,如果用数相同数字个数的方法已经无法有效压缩。但是此时如果对整张图片进行二值化处理,所有大于等于128的我当做255,所有小于128的当做0,此时图片就变为了左黑右白的两个色块,而整体图片也可以利用数相同数字的方法压缩,但是此时图片与原本渐变色已经相去甚远。但是如果我的压缩不是二值化,而是三值呢?图片变为了黑、灰白,四值变为黑、深灰、浅灰、白,当达到一个人类很难分辨的情况时,也就无需原本的保留原始数据了。
  归根结底,压缩的极限看两点,数据原本的规律和最终实用的需求。
  PS:给你举个极限压缩的例子,我能把无穷多的数据压缩到一个字节,3.14159265358979323846…=π
  还真有,要看什么数据,十年前就见过。
  长达15分钟的3D动画,内容包括178MB多媒体纹理、159MB的Wave文件、12条音轨、8亿5千万波样等,未压缩前的体积是1.9GB,压缩后小到只有64KB,即压缩比达到30000:1。
  其实,这些画面是经过计算生成的,但是对电脑性能要求却极低,只要奔腾2以上处理器、256MB以上内存就能运行,这是制作者自己说的,奇客也没有古董电脑测试。
  压缩比最高的应该是7Z极限压缩,但这也要看文件类型,比如奇客想把一张坏光盘做成镜像文件,结果其实数据都是0,但7Z压缩后68KB,要比WinRAR的24KB要大。
  还有视频处理,比如Premiere导出1080P格式MP4,H265比H264压缩比要高,但是码率决定清晰度,1GB源文件是无法压到1MB以下,那样码率可能只有10Kbps,输出效果惨不忍睹。
  都是0,那就压成0和0的个数。几个字节就行。关键是都是0,有啥意义吗?你试试压缩一部电影,压来压去还是95以上的压缩率
  关于这个问题,是不能给出一个关于一般数据的统一答案的。针对数据的不同,答案也不同。
  数据能够被压缩,最重要的关键就是数据中是否含有没有意义的信息、冗余的信息,或者是规律性。这里,我说的是无损压缩,就是数据中的任何信息都没有丢失。
  举个例子,在矩阵中,有一种叫做稀疏矩阵。稀疏矩阵中的0元素占大多数,那么,这个稀疏矩阵的信息就是可以压缩的。具体的压缩算法就是只记录下来非零元素的位置即可。因为非零元素占少数,因此,这比机械的表示整个矩阵要节省很多空间。举个类似的例子,如果你的这个1GB的数据,其中记录的全部都是数字,只有第一个数字是1,其余全部都是零。那么,你只要将"一共有多少个数字,其中第一个数字是1,其余全部都是0"这个信息记录下来就可以了。这远远要小于1GB的数据量。
  另外我举一个有规律性的例子。比如圆周率PI是无限不循环小数。如果把这个小数记录到一个1GB这个大小,那么单纯分析数字本身毫无规律可言。这个时候任何的压缩都是无法保证无损的。但是如果你知道这个数据就是PI,那么你的解压缩算法可以就是一个能够不断计算出PI更多位数的算法,可以在"解压缩"运算中生成原来的1GB的数据。这个极端的例子,可以让数据被压缩到"零",因为解压缩数据完全由算法就可以完成了。
  这个例子也充分说明,离开了具体的数据,去谈压缩率是没有意义的。
  我认为,没有任何规律,没有任何冗余信息的数据,是不能被压缩的。
  问题的最后,我给你分享一个计算机世界之外的信息高度压缩的例子。这个例子,能够充分地体验出造化是多么了不起。人类的发明与之相比,简直太小儿科了。
  一个人类的受精卵,到婴儿出生的时候会发育成大约2000亿个细胞。如果把这理解成解压缩的过程,而所有的解压缩算法都蕴含在这个小小的受精卵中,而更神奇的是,如此巨大的解压缩量,是靠从外界获得输入不断补充成长出来的。
  换句话说,也就是人类的受精卵,是被压缩到"1"的数据,而这个数据中本身又包含了能把数据解压缩成世界上最高等级的新生命的算法。既是数据,又是算法,而且高度压缩。
  无论是解压缩的算法,还是从外部获得物质帮助自己解压缩的过程,都是硅基生命难以望其项背的。
  hash算法能把任意文件编码成一个唯一的256位字符串,如果你能拥有全世界上任意一个hash对应的原始文件,你就可以做到任意长度的文件压缩到256b。
  当然,世界上没有人有这能力,但这并不能阻止大家使用这种模式。我们经常的软件中就有使用这个"压缩"算法的,他就是网盘。
  相信大家在使用网盘上传一些下载来的电影或某些软件的时候会发现时不时的会触发秒传,这种就是网盘客户端在你电脑上先把要上传的文件进行hash,再把hash值上传到服务器查找,如果能找到对应的hash码,则说明这个文件服务器已经有了,你要上传的话,只是把这个hash码标记到你的网盘里就行了。
  所以这算不算压缩呢?

python列表和字典的循环删除方法codingutf8作者wangxingchun日期2022年03月28日列表字典的循环删除。列表的循环删除方法,要求删除姓王的数据lst李四,王一,王二,王三,张三temfori华为跌倒,苹果吃饱文章开始之前,我想请大家想想,身边用苹果手机的人(尤其是原来用华为的用户)是不是越来越多了?3月23日,著名市场调研机构CounterpointResearch发布了一份最新研究报自发光屏幕的新皇之争OLED与MicroMiniLED分析在上期硬件编年史显示器常见背光种类盘点,蓝光最强的它竟然应用最广?中,我们浅析了LCD(非自发光特性)屏幕的一些常见种类以及各个变种产品的优劣之处。而如今在个人消费市场中,随着高端8256G连降1200,首部国产181TB旗舰真香不知道大家发现没有,中兴这个品牌现在的影响力其实不低,但手机的热度有所欠缺,所以整体的品牌销量不高。为什么说中兴手机其实具备很强的影响力?从外观设计和影像上来说吧,我们知道中兴是第骁龙888Plus旗舰,12512到手仅2499!怕难抢总经理提前甩锅手机市场迭代速度越来越快,让人有种眼花缭乱之感,竟然有厂商一年发布了30款新机,平均一个月2部还多。在这之中挑选到心仪的手机还真得下一番功夫!不过,大方向没有变,依旧是看处理器运存参考变形镜头设计,新手机镜头影像尺寸或许能激增11倍想要提高数码相机的拍摄品质,加大感光元件尺寸和改善镜头光学结构是最有效的途径。不过时下流行的拍照工具智能手机却因为手机的尺寸限制,让这两个物理升级方法有点此路不通,各路手机厂商才使MySQL按月自动创建分区表(千万级大表优化)什么是表分区?对用户来说,分区表是一个独立的逻辑表,但是底层由多个物理子表组成,实现分区的代码实际上是通过对一组底层表的对象封装,但对SQL层来说是一个完全封装底层的黑盒子。MyS传长江存储打入苹果供应链鞭牛士3月29日消息,据台媒报道,大陆内存大厂长江存储正式打入苹果的Flash供应链,根据长江存储目前已开始出货的时程来看,应是打入苹果刚发布的iPhoneSE供应链。报道称,以前8点1氪古茗回应因偷漏税被罚1161万税款已补缴,加盟店铺均不受影响近期,古茗奶茶关联公司浙江古茗科技有限公司被台州市税务局罚款1161万余元。具体事由为,该公司不进行纳税申报,不缴或者少阿里云服务器被攻击根据全球游戏和全球移动互联网行业第三方分析机构Newzoo的数据显示2017年上半年,中国以275亿美元的游戏市场收入超过美国和日本,成为全球榜首。游戏行业的快速发展高额的攻击利润电商突围系列阿里引领中概股回购潮自救还是价值重估?21世纪经济报道记者陶力上海报道在美股市场动荡之际,中国互联网公司在近日掀起了回购潮,以求在增长放缓之时,能够稳定投资者的情绪。3月22日早间,阿里巴巴宣布继续扩大回购,将股份回购
千亿券商被立案调查!半年领6张罚单,仍大赚80亿除了永煤事件外,海通证券还因合规等问题频频被监管点名,但这并不影响其创收,今年上半年净利润同比增长近50。本文由无冕财经(wumiancaijing)原创发布作者黄琪鑫编辑陈涧设计变革下的物企赛道,融创服务如何外秀实力内修功力?wumiancaijing。com融创服务实现营收规模双增长的同时,如何提高服务竞争力?在物业行业监管趋严的背景下,融创服务又将如何应对?本文由无冕财经(wumiancaijing总部清场欠债欠薪,是什么压垮了这家老牌旅行社?南湖国旅欠着本该付给供应商的大量费用,手上还有来自游客的收入,但疫情前就已开始拖欠工资关闭门店,南湖国旅为何陷入困境?本文由无冕财经(wumiancaijing)原创发布作者陈欣苗钢铁首富接盘ST海航,为何三家上市公司齐齐跌停?wumiancaijing。com截至今年6月,海航收到债权申报额超过1。2万亿元,这也许可以理解,为何是总资产超过千亿的方大集团爆冷接盘航空主业。本文由无冕财经(wumianca立志成为全球标志性科技品牌的荣耀,做了一个大动作深度视频加载中今年1月底,荣耀CEO赵明在荣耀独立后的第一次公开演讲中表示,荣耀的新定位是全球标志性的科技品牌。理解起来,就是全球化高端化。全球化是荣耀获得更大发展空间的必然而只有冲击美杜莎古希腊神话中的蛇发女妖美杜莎(Medusa),又译梅杜莎墨杜萨,是古希腊神话中的蛇发女妖,也是熟为人知的怪物,其人头蛇身,头发遍布蛇头,外貌显得格外狰狞,武器为弓或者是马来剑。美杜莎曾经是一位美丽的少女中国古代在天文历法上的成就先秦时期春秋时期,留下了世界上公认的首次哈雷彗星的确切记录。春秋记载,公元前613年,有星孛入于北斗,即指哈雷彗星,这一记录比欧洲早六百多年。春秋时期我国历法已经形成自己固定的系统中国古代在数学物理学医药学上的成就数学成就两汉时期九章算术约成书于东汉,分九章介绍了许多算术命题及其解法,是当时世界上最先进的应用数学,它的出现标志中国古代数学形成了完整的体系。南北朝时期魏晋时期的数学家刘徽,运用中国古代在地理学建筑学及著作上的成就地理学成就南北朝时期西晋时期,裴秀是中国古代杰出的地图学家。绘制出禹贡地域图,还提出了绘制地图的原则。北魏时期,地理学家郦道元的水经注,通过为古书水经作注,以水经为纲,全面而系统地梯影传媒连续完成B4B5两轮融资,以数字化推动商业模式创新商务楼宇头部媒体运营商梯影传媒宣布,连续完成B4B5两轮融资。其中,B4轮由绿地金创独家投资。B5轮由老股东博将资本领投,韩国未来资产(MIRAEASSET)蓝图创投跟投。至此,梯董事长被抓,神秘基金会股权清零,海航重整行至关键时刻焦点wumiancaijing。com接下来几天,海航的321家合并重整企业商业板块供销大集的债委员将会相继召开,海航迎来最后的大考。本文由无冕财经(wumiancaijing)整合报