您的位置：首页 > 编程语言 > PHP开发

初始FTP

2016-08-05 00:18 183 查看

FTP简介：

１，文件传输协议FTP（File Transfer Protocol由RFC959描述）

２，FTP设计的目的是为了不同主机之间高效的文件传输，能够屏蔽不同主机不同的文件系统的差异

３，工作在TCP/IP协议族的应用层，传输层使用的是TCP协议，是基于客户／服务器模式工作的

FTP所支持的文件类型（因为是在不同主机的不同文件系统之间进行数据传输，文件共享）：

１，ASCII码文件，这是FTP默认的文本格式

２，EBCDIC码文件，它也是一种文本类型文件，用８位代码表示一个字符，该文本文件在传输时，要求两端都使用

　　EBCDIC格式

３，图像（Image）文件，也称之为二进制文件，发送的数据为连续的比特流，通常用于传输二进制文件

４，本地文件，（传输的字节数总是由８个ｂｉｔ数构成，但是：逻辑字节数并不总是８个ｂｉｔ数，尽管我们现在　　所看到的主机的逻辑地址总是８个．实际上，在早期，有一些主机，它的逻辑字节可能是１０位，也可能是３６　　位，当然也可能是其他的位数，这个时候，逻辑字节数就是由发送方来规定的），所以说：本地文件的字节大小　　由本地主机来决定，也就是说：字节的大小是不定的．

　　因为ｆｔｐ是在不同主机不同的文件系统中传输，所以支持这种文件

实际上，大部分的ｆｔｐ服务器仅仅只是实现了ASCII码文件，图像（Image）文件的传输，而其他的两种文件已经不长用了，所以我们现在编写的ｆｔｐ也就仅仅只支持ASCII码文件，图像（Image）文件

ASCII码文件：也称为文本文件，如果我们用一个文本编辑器来打开一个文本文件，那么就会将一个个字符显示出来

二进制文件：如果同样的，我们用文本编辑器来打开，很有可能显示的是乱码，，

（上面这些都是我们最直观的感受）

实际上，两者在物理上或者存储结构上没有本质的区别，，，都是由一系列比特位构成的

不同仅仅在逻辑上，或者说系统对它们的解析方式不同

ASCII码文件是由ASCII字符构成的，由７位ｂｉｔ位构成（１２８个字符），最高位总是０（如果最高位１，那么文　　　　　本编辑器很有可能就无法显示，显示的是乱码）

所以说：二进制文件当中的一个字符的最高位很可能是１

这就是两者之间的差别．．．．（还有一个就算：\r\n之间的解析方式不同，我们知道不同的系统的换行符是不一样　　　　　的）

　　　　ｗｉｎｄｏｗｓ：换行符就是\r\n

　　　　Ｌｉｎｕｘ：换行符就是\n

　　　　ｍａｃ：换行符就是\r

　　　　也就是说：在ｗｉｎｄｏｗ下打开一个ｔｘｔ文件，我们输入ａｂｃ，并且按下回车，保存退出，那么当前

　　　　　　　　　这个文件的大小就应该是５（ａ，ｂ，ｃ，＼ｒ，＼ｎ）

也就是说：对于上传的文件（如果是ａｓｃｉｉ码文件，从ｗｉｎｄｏｗ　－＞　Ｌｉｎｕｘ，那么会将\r\n转换为

　　　　　\n，从Ｌｉｎｕｘ　－＞　ｗｉｎｄｏｗ，那么会将\n转换为\r\n）

　　　　　如果我们强行将上面ｔｘｔ文件中的＼ｒ给删除掉的话，那么就变成了二进制上传，传过去不会有影响的

　　　　　如果还是上面的ｔｘｔ文件（包括＼ｒ＼ｎ），并且强制为二进制上传，那么变成什么了呢？？？？

　　　　　我们会发现Ｌｉｎｕｘ不做任何的解析，这就是它们之间的差别

　　　　　简而言之：就是我们的上传的过程中，不建议用ａｓｃｉｉ码文件上传，因为可能会造成字节的丢失．

FTP文件的数据结构：

１，文件结构：这是ＦＴＰ默认的方式，文件被认为是一个连续的字节流，文件内部没有表示结构的信息

２，记录结构：由连续的记录构成，该结构只用于文本文件（ASCII码文件，EBCDIC码文件）

３，页结构：在ＦＴＰ中，文件的一个部分被称为页．当文件是由非连续的多个部分组成的，那么使用页结构

　　　　　　这种文件称为随机访问文件，每页都带有页号发送，以便接收方能随机的将各个页存储在存储空间中

文件的数据结构会影响文件的传输方式和存储方式

ＦＴＰ文件的传输方式

１，流方式：这是支持文件传输的默认方式，文件以字节流的方式传输（现如今，主流的ｆｔｐ服务器）

２，块方式：如果文件是以记录结构的话，那么就可以以块的方式传输，每块前面都带有自己的头部（描述子代码　　　域（８ｂｉｔ），计数域（１６ｂｉｔ）），描述子代码域定义数据块结束标志内容，计数域说明了数据块的

　　字节数

３，压缩方式，主要用于对连续出现相同的字节进行压缩，现在已经很少使用啊

ＦＴＰ的工作原理：

１，ＦＴＰ是一个Ｃ／Ｓ架构的软件

　　客户端有一个用户界面（可以是比较流行的Ｌｅａｐｆｔｐ的图像界面，也可以是文本界面（命令行的方式

　　来使用））

２，一旦有用户的一个操作就会通过用户协议解析器转换成对应的ＦＴＰ命令，通过一个控制连接发送给FTP服务器　　端，这个控制连接的端口号是２１，（首先：客户端跟服务端要建立连接，客户端去连接服务端的２１端口，

　　建立一个控制连接，控制连接主要是传输命令以及命令的响应，传输命令是由：客户端到服务端；响应命令是　　　由：服务端到客户端）

３，一旦服务器协议解释器解析到了文件传输的命令之后呢？？？

　　服务端就要跟客户端建立一个新的通道（数据连接通道，这个通道可以由客户端连接过来，也可以由服务端连接　　过来，对应两种不同的工作模式），用于传输文件，当然：

　　如果是上传的话：客户端读取本地系统当中的文件，传输给服务器端，那么服务器端就将其写入到服务器端的文　　件系统

　　如果是下载的话：服务端就读取服务端文件系统中的东西，通过数据连接通道，传回给客户端，写入到本地的文　　件系统中的

　　　当我做一个动作，就会产生对应的ｆｔｐ命令（比如刷新），

　　　可能会产生这些命令：

　　　TYPE A（表示以ａｓｃｉｉ码的方式来传输）

　　　PORT（实际上，对应ＦＴＰ的主动模式（ｆｔｐ有两种模式，一种是主动模式，一种是被动模式），用于建　　　立数据连接）ｆｔｐ的核心是传输文件，通道不是采用控制连接，而是采用数据连接，那么这时候，就需要建　　　立一个数据连接，那么如何建立数据连接呢？？？也需要双方来进行协商，这里是通过主动模式来进行协商的

　　　，一旦服务端得到了这样的数据，就可以建立数据连接，一旦数据连接建立好之后呢，就给客户端一个响应，

　　　那么客户端就发送一个ＬＩＳＴ的长输入列表（也是通过数据连接通道来进行传输的），那么一旦传输完成数　　　据连接就可以关闭了

　　　这些就算一个简单的响应，用户的一个动作就会解析出响应的命令（如删除）

对于上面提到的两个连接，控制连接不会关闭，保留时间长，除非我们将控制段关闭，而数据连接通道时间很短，传输完毕就会关闭．

还有就是数据连接的通道：可以是服务端连接过来，也可以是客户端连接过来的．

ＦＴＰ相对应的命令：

１，访问控制命令：ＵＳＥＲ（服务器上的用户名）

　　　　　　　　　ＰＡＳＳ（用户口令，匹配上之后会发送一个响应）

　　　　　　　　　ＣＷＤ和ＸＣＷＤ（改变工作目录）

　　　　　　　　　ＣＤＵＰ和ＸＣＵＰ（回到上一层目录，父目录）

２，传输参数命令：ＰＯＲＴ（数据端口，主要向服务器发送客户数据连接的端口，格式为：

ＰＯＲＴ　h1,h2,h3,h4, p1,p2）h表示３２位ｉｐ，ｐ表示１６位端口号

　　　　　　　　　ＰＡＳＶ（此命令要求服务器数据传输进程在随机端口上监听，进入被动接受请求状态）

　　　　　　　　　ＴＹＰＥ（文件类型：ａｓｃｉｉ或者二进制）

．．．．．．．．（后面还有好多啊）

ＦＴＰ的应答：

１，不管是ＦＴＰ的命令或者应答都要在后面加上一个回车和换行（＼ｒ＼ｎ），都是以此结尾的．

２，如果要产生多行应答，那么第一行就是：３位数字加上＂－＂在加上应答内容，在最后的时候，我们需要：

　　３位数字加上＂　＂（空格）再加上应答内容

　　多行应答大部分的情况是对ｈｅｌｐ而言的，而其他的应答是一行（数字＋空格）

作用：确保在文件传输过程中，请求和正在执行的动作保持一致，如果没有客户端没有获得应答，那么客户端就会阻　　　塞，直到接收到应答，从而达到同步的目的

　　　客户端可以获知服务端当前的状态，根据状态确定发出的请求正确与否．．．

数字含义：

第一位数字标示了响应是好，坏，未完成

１ｘｙ　　　预备状态

２ｘｙ　　　完成状态

３ｘｙ　　　中间状态

４ｘｙ　　　暂时拒绝状态

５ｘｙ　　　永久拒绝状态

第二位数字标示了发生了什么错误，文件系统，语法错误

０：标示语法错误，给出的命令不存在，多余或没有实现

１：标示信息，对于请求信息的响应

２：标示连接，对于控制连接或者数据连接的响应

３：身份验证和账号

４：未使用

５：文件系统

第三位为第二位更详细的说明：

５００：（语法错误，命令不能识别）

５０１：（参数语法错误）

５０２：（命令没有实现）

５０３：（命令顺序错误）

５０４：（没有实现这个命令的参数）

ＦＴＰ由两种类型的连接构成：

１，控制连接：主要接收ＦＴＰ客户端发送过来的命令请求，并且对这些请求进行应答

２，数据连接：主要是双方数据的传输，包括目录列表的传输以及文件的传输

ＦＴＰ两种工作模式（主要是针对数据连接而言的）：

　　我们直到控制连接的建立：总是由客户端向服务端发起

　　而数据连接通道是不一样的

　　１，主动模式（服务器端向客户端发起连接而建立数据连接通道）

　　２，被动模式（客户端向服务器端发起连接而建立数据连接通道）

　　

　　其实，主被动主要是针对服务器端而言的，（服务器端主动的发起连接而建立的通道：主动模式）

　　（服务器端被动的接收连接而建立的数据通道：被动模式）

　　主动模式：

　　

　　１，首先要建立一个控制连接通道（如上图：是客户端向服务端的２１端口发送一个连接，经过三次握手，建

　　　　立控制连接通道，客户端本地也会选择一个动态的端口号ＡＡ，一旦控制连接通道建立好之后，双方就可

　　　　以交换信息了）

　　２，客户端可以通过控制连接通道向服务端发起命令请求，服务器端也可以通过控制连接通道对这些命令请求

　　　　进行应答

　　３，如果要涉及到数据的传输，那么一定要创建一个数据连接（首先，我们要选择一下工作模式）

　　　　如果是ＰＯＲＴ模式：客户端会向服务端发送一个ＰＯＲＴ命令（也是通过控制连接通道来完成的，向服

　　　　务端的２１端口号传输一个ｐｏｒｔ命令，并且告知客户端的一个端口号ＢＢ，因为这个信息，服务端才

　　　　直到要连接客户端的哪一个端口号，然后就向ＢＢ端口发起了一个连接的请求，建立了一个数据连接通道

　　　　，一旦建立完成就可以进行传输了，包括目录列表的传输以及文件的传输，传输完毕。数据连接通道就会关

　　　　闭掉，是临时的）

　　４，而且值得我们主要的是：服务端主动连接的时候，服务端选择的是２０的端口

　　　　一般情况下：Ａ端连接Ｂ端的时候，Ａ端不会选择一个确定的端口（一般都是动态的端口）

　　

　　１，客户端首先向服务端发起一个ＰＯＲＴ命令

　　　　ＰＯＲＴ首先需要ＩＰ和一个端口，通过控制命令端口发送（PORT h1,h2,h3,h4,p1,p2）

　　　　后面两个数字：是端口号。。。。。ｐ１表示端口的高八位，ｐ２表示端口的低八位（如

上：209*256+115 = 53619，到时，服务端要去连接这个端口号）

　　　　ＰＯＲＴ模式是主动模式，表示服务端要主动连接客户端

　　　　首先要创建一个数据套接字（ＴＣＰ），并且绑定一个临时的端口号（就是我们上面求的）（可以用

　　　　ｂｉｎｄ（０）来表示绑定了一个临时的端口号，但是由于绑定了一个临时的端口号，我们并不了解到底

　　　　是哪一个端口号，我们还必须用getsockname()来获取绑定的到底是哪一个端口号），绑定完了之后

　　　　还需要进行监听，，，

　　２，一旦服务端收到这条ＰＯＲＴ命令的话，并没有马上建立数据连接，只是将这些信息暂存起来（ＩＰ和

　　　　端口暂存起来，以便后续建立数据连接）

　　　　服务端将给客户端一个２００的响应。。。

　　３，客户端收到这个响应之后，就可以真正的给服务端发送一个数据传输请求，也就是ＬＩＳＴ请求。

　　　　服务端收到这个命令之后，要进行检测服务端是不是接收到了ＰＯＲＴ或者ＰＡＳＶ命令（主被动）。

　　　　如果没有接收过：则响应一个４２５　Ｕｓｅ　ＰＯＲＴ　ｏｒ　ＰＡＳＶ　ｆｉｒｓｔ

　　　　如果有接收过：并且是ＰＯＲＴ（主动模式），那么服务端就会连接客户端，会创建套接字（并且绑定

　　　　２０端口号，调用ｃｏｎｎｅｃｔ主动连接客户端ＩＰ和端口号，从而建立一个数据连接通道）

　　　　一旦通道连接完毕，要告知客户端已经连接就绪了

　　４，那么这时候，服务端会向客户端一个应答。１５０，表示已经准备就绪，可以开始传输了

　　５，数据列表的传输

　　６，列表传输完毕，服务端发送给客户端一个２２６的应答。表示传输完毕。。。。。

　　　　服务端主动的关闭数据套接字。。然后客户端得到信息，也关闭了数据套接字。。

　　　　

　　　　我们知道这个时候从编程模型上来看：

　　　　客户端相当于一个服务器，服务端相当于一个客户端（所以说：有时候客户端与服务端的界限不是很明确）

　　　　从用户的角度来看，不管数据连接是如何建立的（不去考虑太多的东西）

被动模式：

　　　　　

　　　１，如上图：首先也是客户端给服务端的２１端口发送连接，建立控制连接通道。

　　　２，选择传输模式，客户端会通过控制连接通道发送ＰＡＳＶ命令向服务端。表示被动模式。。。。。。。。

　　　　　说明：客户端到时要连接服务端，前提是得知道要连接哪一个端口号（这时候，就需要告知数据连接通

　　　　　道的端口号，因而服务端会向客户端一个应答。。。ｘｘ：端口号）

　　　３，一旦客户端接收到应答之后，就可以向那个端口发起连接了，从而建立一个数据连接通道，。

　　　

　　　实际上：主被动命令是由客户端来选择的。因为是客户端发起主被动命令的。。。。

　　　１，客户端向服务端发起一个ＰＡＳＶ命令

　　　２，服务端以一个２２７的响应。PORT
h1,h2,h3,h4,p1,p2将ＩＰ和端口以这种方式响应给客户端。

　　　　　这意味着服务端需要在一个端口号上进行监听。因而需要创建一个数据套接字。绑定一个临时的端口，

　　　　　然后在套接字上进行监听。。。还要通过ｇｅｔｓｏｃｋｎａｍｅ来获取实际绑定的端口号

　　　　　。响应给客户端。以便客户端发起数据连接的请求。

　　　３，客户端向服务端发送ｌＩＳＴ命令。服务端首先判定之前是不是收到ＰＯＲＴ或者ＰＡＳＶ命令

　　　　　如果没有的话，依然响应一个：４２５　Ｕｓｅ　ＰＯＲＴ　ｏｒ　ＰＡＳＶ　ｆｉｒｓｔ

　　　　　如果有的话，并且是ＰＡＳＶ，则服务端调用ａｃｃｅｐｔ接收客户端的请求。从而建立数据连接

　　　４，然后，服务端向客户端响应一个１５０，表示准备就绪，可以传输了　

　　　５，开始传输

　　　６，服务端发送２２６应答给客户端，表示传输结束。。。。断开数据连接通道。。。

　　　同样一个简单的问题：

　　　ＦＴＰ服务器：为什么要有两种工作模式呢？？？为什么要存在主动模式，被动模式呢？？？

　　　这实际上跟ＮＡＴ或者防火墙对主动模式或者被动模式有关系的。。。。

　　　什么是ＮＡＴ？？？

　　　１，全称是：Network Address Translation网络地址转换。通过ＮＡＴ可以将内网私有ＩＰ地址转换为公网

　　　　　ＩＰ地址。一定程度上解决了公网地址不足的问题。。。

　　　　　我们知道：局域网上的主机很多都没有公网的ＩＰ。但是我们局域网上的主机要跟外界进行通信，这个

　　　　　时候就需要得到一个公网的ＩＰ地址。这个时候，就涉及到了ＮＡＴ

　　　　　

　　　　　私有的ＩＰ地址不能直接跟公网的ＩＰ地址进行通信。那么这个时候就要进行地址转换。

　　　　　通过一个ＮＡＴ服务器（双网卡，有两个接口，一个局域网的接口，一个连至公网）

　　　　　如上：客户端（192.168.1.100）要跟服务端（50.118.99.200）进行通信，那么会首先经过一个

　　　　　ＮＡＴ进行地址映射。将（192.168.1.100）地址转换为：(120.35.3.193)从而连接外网的一个服务器。

　　　　　同时还有一个端口的映射。。。

　　　　　也就是说：局域网中的主机基本上都没有配备公网ＩＰ，利用ＮＡＴ公用一个公网，进行外界通信。。。

２，ＮＡＴ跟ｆｔｐ的主被动关系！！！

　　１，ｆｔｐ客户端处于ＮＡＴ或防火墙之后的主动模式

　　

１，主动模式是先创建控制连接通道（由于局域网上的主机无法访问Ｉｎｔｅｒｎｅｔ网上的服务器，因而

　　　　　　需要经过ＮＡＴ服务器。。）ＮＡＴ服务器有一个特征：如果是从内部向外建立连接，那么是可以的。

　　　　　　客户端从内部向外界发起连接，这时候ＮＡＴ服务器内部会维护一个表目（ＩＰ的映射）

　　　　　　从而建立控制连接通道。

　　　　　　实际上：服务端收到的ＩＰ和端口号，是由ＮＡＴ转换后的ＩＰ和端口号。。。

　　　　　　（192.168.1.100，５３９０）地址转换为：(120.35.3.193，５３９０)

　　　　　　上面的端口号为5390，我们假设它们的端口号都没有改变，同等映射。

　　　　　　外界主动发起的连接，连接的也是ＮＡＴ的ＩＰ和端口号

　　　　　　实际上：ＮＡＴ并没有在ＢＢ端口号上进行监听，是客户端在ＢＢ端口号上进行监听。。。因此：服务

　　　　　　器和ＮＡＴ没有办法成功建立连接（也就是说：服务器并没有将局域网上的客户端当做客户端，实际

　　　　　　上是将这个ＮＡＴ服务器当做一个客户端的，但是它本不是客户端，所以连接建立失败）

　　　　　　如何解决这个问题呢？？

　　　　　　１，在ＮＡＴ服务器上配置映射，允许服务端连接过来（我们要配置映射条目，手工的）

　　　　　　　　如果是手工的配置的话，那么就需要知道服务端到底是哪一个端口连接过来的，这也是服务端这边

　　　　　　　　建立一个连接绑定２０端口的原因。而不是让其动态选择。

　　　　　　　　如果是动态选择的话，那就说明ＮＡＴ要维护的映射信息就会很多。　

　　　　　　　　当然：也有一些ＮＡＴ能自动的维护条目，但是需要确定的端口２０，２１的协调

　　

　　２，ｆｔｐ客户端处于ＮＡＴ或防火墙之后的被动模式

　　　　

　　　　１，客户端向服务端２１端口发起连接，可以成功

　　　　２，通过控制连接通道发起了一个ＰＡＳＶ请求

　　　　３，服务端会创建一个数据套接字绑定监听端口号ｘｘ，并且将这个信息告知给客户端，以便客户端向

　　　　　　这个端口ｘｘ发起连接

　　　　４，客户端发起连接跟服务端ｘｘ建立，总能够成功

ｆｔｐ服务器处于ＮＡＴ或防火墙之后的被动模式

　　　　

　　　　也就是说：这个服务器是在局域网中的，并没有跟外界连通。服务器处于防火墙之后。

　　　　客户端要连接服务器，实际上要通过ＮＡＴ服务器，

　　　　首先，客户端（处于ＩＮＴＥＲ之上）与ＮＡＴ建立一个连接（三次握手，建立控制连接通道）ＮＡＴ

　　　　也需要一个映射，将２１端口号映射至服务器端才可以，这样就实现了客户端跟服务端的建立。

　　　　实际上：客户端总是跟ＮＡＴ进行交互的，因为有公网的ＩＰ地址。

　　　　同样的，最终的通道客户端发起ｘｘ（ＮＡＴ没有办法维护）失败。。。（从外界发起无法成功）

　　　　　　

　　　　　　这回就是可以的了，，，，

　　　　

　　　　　　　　

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航