博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
生成1000万行7位数字文件(编程珠玑)
阅读量:6759 次
发布时间:2019-06-26

本文共 494 字,大约阅读时间需要 1 分钟。

生成1000万行7位数字文件(编程珠玑)

今天看《编程珠玑》排序的问题。输入是一个千行文件。每行是7位数字。而且无反复。搜索了下。没有现成的数据集,所以简单用python生成了下。尽管简单!

思路:顺序生成,然后shuffle。

#!/usr/bin/pythonf = open("numbers.txt", "w");for i in range(0, 9999999):    s = str(i)    s = s.zfill(7)    s = s + '\n'    f.write(s)f.close()

RUN:得到的数据集大小是77M

python generate-numbers.py ls -l --block-size=M numbers.txt shuf -o outoforder.txt numbers.txt head -n 10 outoforder.txt
  • python整型和字符串的转换:int(), str()
  • 利用进行字符串的填补
  • 显示文件大小 ls -l –block-size=M
  • 使用shuf命令将文件行随机排列 。从而得到相应的数据集。

转载地址:http://wcweo.baihongyu.com/

你可能感兴趣的文章
Pthon Matplotlib 画图
查看>>
十种排序算法实例说明总结
查看>>
Python 语言之 map/reduce
查看>>
Vue.js - Day4
查看>>
mysql之用户
查看>>
053(三十五)
查看>>
AddonSU Packages now available for LineageOS 15.1
查看>>
UVa 10970 - Big Chocolate
查看>>
SpringMVC上传图片总结(1)---常规方法进行图片上传,使用了MultipartFile、MultipartHttpServletRequest...
查看>>
小米:开源不仅要站在巨人的肩膀上,还要为巨人指方向
查看>>
百度启动高管退休计划,总裁张亚勤今年十月退休
查看>>
SpringBoot启动时的Banner设置
查看>>
xming + putty 搭建远程图形化ssh访问ubuntu 14.04
查看>>
【Sigma敏捷版系列文章】从运行流程和list-watch看kubernetes系统的设计理念
查看>>
两列布局——但只用右浮动
查看>>
GNOME 网页浏览器 Epiphany 将要进行 5 项改进
查看>>
今年CES最大亮点:智能语音助手正成为新趋势
查看>>
Windows Mysql Server重启, log-bin路径配置
查看>>
刘剑锋:友云采助力企业数字化采购的新发展
查看>>
Rainbond 5.0.4 发布,做最好用的云应用操作系统
查看>>