使用python3批量下载rbsp数据的示例代码

时间:2021-05-23

1. 原始网站
https://www.rbsp-ect.lanl.gov/data_pub/rbspa/

2. 算法说明
进入需要下载的数据所在的目录,获取并解析该目录下的信息,解析出cdf文件名后,将cdf文件下载到内存中,随后保存到硬盘中。程序使用python3实现。

3. 程序代码

#!/bin/python3# get the rbsp data# writen by Liangjin Song on 20191219import sysimport requestsfrom pathlib import Path# the url containing the cdf filesurl="https://www.rbsp-ect.lanl.gov/data_pub/rbspa/ECT/level2/2016/"# local path to save the cdf filepath="/home/liangjin/Downloads/test/"def main(): re=requests.get(url) html=re.text cdfs=resolve_cdf(html) ncdf=len(cdfs) if ncdf == 0: return print(str(ncdf) + " cdf files are detected.") i=1 # download for f in cdfs: rcdf=url+f lcdf=path+f print(str(i)+ " Downloading " + rcdf) download_cdf(rcdf,lcdf) i+=1 return# resolve the file name of cdfdef resolve_cdf(html): cdfs=list() head=html.find("href=") if head == -1: print("The cdf files not found!") return cdfs leng=len(html) while head != -1: tail=html.find(">",head,leng) # Extract the cdf file name cdf=html[head+6:tail-1] head=html.find("href=",tail,leng) if cdf.find('cdf') == -1: continue cdfs.append(cdf) return cdfsdef download_cdf(rcdf,lcdf): rfile=requests.get(rcdf) with open(lcdf,"wb") as f: f.write(rfile.content) f.close() returnif __name__ == "__main__": lpath=Path(path) if not lpath.is_dir(): print("Path not found: " + path) sys.exit(0) sys.exit(main())

4. 使用说明

url为远程cdf文件所在路径。
path为本地保存cdf文件的路径。
url和path的末尾都有“/”(Linux下情形,若是Windows,路径分隔符为“\\”,则path末尾应为“\\”)。

5. 运行效果

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章