Linux wget命令详解

1    510    4

Tags:

👉 本文共约3668个字,系统预计阅读时间或需14分钟。

wget命令简介

wget命令用来从指定的URL下载文件。wget非常稳定,它在带宽很窄的情况下和不稳定网络中有很强的适应性,如果是由于网络的原因下载失败,wget会不断的尝试,直到整个文件下载完毕。如果是服务器打断下载过程,它会再次联到服务器上从停止的地方继续下载。这对从那些限定了链接时间的服务器上下载大文件非常有用。

wget命令是Linux系统用于从Web下载文件的命令行工具,支持 HTTP、HTTPS及FTP协议下载文件,而且wget还提供了很多选项,例如下载多个文件、后台下载,使用代理等等,使用非常方便。

安装

选项参数

选项描述
-a<日志文件>在指定的日志文件中记录资料的执行过程;
-A<后缀名>指定要下载文件的后缀名,多个后缀名之间使用逗号进行分隔;
-b进行后台的方式运行wget;
-B<连接地址>设置参考的连接地址的基地地址;
-c继续执行上次终端的任务;
-C<标志>设置服务器数据块功能标志on为激活,off为关闭,默认值为on;
-d调试模式运行指令;
-D<域名列表>设置顺着的域名列表,域名之间用“,”分隔;
-e<指令>作为文件“.wgetrc”中的一部分执行指定的指令;
-h显示指令帮助信息;
-i<文件>从指定文件获取要下载的URL地址;
-l<目录列表>设置顺着的目录列表,多个目录用“,”分隔;
-L仅顺着关联的连接;
-r递归下载方式;
-nc文件存在时,下载文件不覆盖原有文件;
-nv下载时只显示更新和出错信息,不显示指令的详细执行过程;
-q不显示指令执行过程;
-nh不查询主机名称;
-v显示详细执行过程;
-V显示版本信息;
–passive-ftp使用被动模式PASV连接FTP服务器;
–follow-ftp从HTML文件中下载FTP连接文件。

启动

日志和输入文件

下载

目录

HTTP选项

HTTPS (SSL/TLS) 选项

FTP选项

WARC options

递归下载

递归接受/拒绝

示列

设置使用指定浏览器下载(伪装下载)

使用 wget 下载单个文件

以下的例子是从网络下载一个文件并保存在当前目录

在下载的过程中会显示进度条,包含(下载完成百分比,已经下载的字节,当前下载速度,剩余下载时间)。

使用 wget -O 下载并以不同的文件名保存

我们可以使用参数-O来指定一个文件名:

使用 wget -c 断点续传

使用wget -c重新启动下载中断的文件:

对于我们下载大文件时突然由于网络等原因中断非常有帮助,我们可以继续接着下载而不是重新下载一个文件

使用 wget -b 后台下载

对于下载非常大的文件的时候,我们可以使用参数-b进行后台下载

你可以使用以下命令来察看下载进度

伪装代理名称下载

有些网站能通过根据判断代理名称不是浏览器而拒绝你的下载请求。不过你可以通过–user-agent参数伪装。

使用 wget –spider 测试下载链接

当你打算进行定时下载,你应该在预定时间测试下载链接是否有效。我们可以增加–spider参数进行检查。

你可以在以下几种情况下使用spider参数:

使用 wget –tries 增加重试次数

如果网络有问题或下载一个大文件也有可能失败。wget默认重试20次连接下载文件。如果需要,你可以使用–tries增加重试次数。

使用 wget -i 下载多个文件

使用 wget –mirror 镜像网站

使用 wget –reject 过滤指定格式下载

你想下载一个网站,但你不希望下载图片,你可以使用以下命令。

使用 wget -o 把下载信息存入日志文件

你不希望下载信息直接显示在终端而是在一个日志文件,可以使用以下命令:

下载单个文件到当前目录

这里下载nginx最新稳定版nginx-1.22.1.tar.gz到当前目录/app下:

下载文件到当前目录并重命名

以上面下载nginx-1.22.1.tar.gz文件为例,通过使用-O(大写)选项将下载的文件命名为nginx.tar.gz

将文件下载到指定目录

默认情况下,wget将下载的文件保存在当前工作目录中,使用-P(大写)选项可以将文件保存到指定目录下,例如,下面将将文件下载到/opt/mydownload目录下:

断点续传功能使用

当下载一个大文件时,如果中途网络断开导致没有下载完成,这时候不用从头重新下载,可以使用命令的-c(小写)选项恢复下载,让下载从断点续传。

后台下载文件

这里使用-b(小写)选项进行后台下载:

本人提供Oracle(OCP、OCM)、MySQL(OCP)、PostgreSQL(PGCA、PGCE、PGCM)等数据库的培训和考证业务,私聊QQ646634621或微信db_bao,谢谢!

这时,前台下载不显示进度,可以查看wget-log日志:

同时下载多个文件

在当前目录下,创建一个文件,然后每行写一条要下载文件的URL:

然后同时下载:

不检查证书下载文件

有些网站需要安全性检查,这时使用--no-check-certificate参数继续下载:

提示,要以不安全的方式连接至 dlcdn.apache.org,使用“--no-check-certificate”。

增加重试次数下载文件

如果网络有问题或下载一个大文件有可能会下载失败,wget默认重试20次,我们可以使用-tries选项来增加重试次数。

通过FTP下载文件

如果要从受密码保护的FTP服务器下载文件,需要指定用户名和密码,格式如下:

下载一个完整的网站

基中:

-c 断点续传

-r 递归下载,下载指定网页某一目录下(包括子目录)的所有文件

-np 递归下载时不搜索上层目录

-k 将绝对链接转为相对链接,下载整个站点后脱机浏览网页

-L 递归时不进入其它主机

-p 下载网页所需的所有文件,如图片等

参考

https://mp.weixin.qq.com/s/5xTfDf5FyWO6PUVr0ytG0w

标签:

头像

小麦苗

学习或考证,均可联系麦老师,请加微信db_bao或QQ646634621

您可能还喜欢...

1 条回复

  1. 头像 xn说道:

    整理的很详细,希望持续输出

发表回复

嘿,我是小麦,需要帮助随时找我哦
  • 18509239930
  • 个人微信

  • 麦老师QQ聊天
  • 个人邮箱
  • 点击加入QQ群
  • 个人微店

  • 回到顶部
返回顶部