网络编程 socket详解 TCP socket和UDP socket-程序员宅基地

技术标签: 网络  服务器  socket  网络协议  tcp/ip  

概述

        我们在网络编程时,通常是让我们本地的应用程序和远程的应用程序进行通信,也就是分布式的进程之间的通信,比如我写的程序A和小明的程序B进行通信,我的程序运行时在本机就是一个进程,是有pid号的,小明的也是。那这两个程序是怎么通信的呢?

        这就要理解网络分层的概念了,网络层实现的是主机到主机之间的通信,网络层的实现是ip协议,通过各自的ip地址就能实现远程数据传输,而网络层只是保证了主机A的数据能够到达主机B,并不能够识别和发送到对应的进程,而传输层实现的是进程到进程的通信,对网络层的功能进行了加强,能够把数据交付给对应的进程。

        有了传输层的功能,我们用户才能进一步的去实现自己的应用层协议,实现应用。当我们需要远程通信时只需要通过下层的传输层传输数据即可

        但是想象一下,每次我在应用层发送数据时至少都是需要把 要发送的信息、本机ip、本地端口、目的ip和目的端口这五个数据通过层间接口交给传输层(对于TCP协议来说的,UDP无连接不需要应答所以不需要本机ip和端口),如下图

         但是每一次应用层向传输层发送数据时都需要发送这些数据是不是很多余?TCP一旦双方建立起连接了,那么除了数据部分,其他的都是相同的,没有必要每次发送数据都发送一遍,为了减少层间接口的传输量,就出现了socket,操作系统底层维护一个列表,用于存放多个socket,即多个会话关系。

        socket套接字是传输层提供给应用层的一个API,底层实现就是一个整数,是传输层和应用层的一个约定,该整数就像是打开一个文件并得到文件句柄一样,对这个句柄进行的操作就是对该文件进行操作,方便管理。

有了socket之后应用层数据的传输就变为了这样

传输层概述

        先来说说网络层的ip,ip协议在网络上发送数据包是不可靠的,有可能造成丢失,乱序等问题,如发送数据包到对应的路由器,路由器有接收缓冲区,如果发现同一时刻来的数据包太多了,缓冲区放不下,它是可以把装不下的数据包扔掉的。这就是不可靠的传输。

传输层提供了TCP和UDP两种服务:

  • TCP:对ip协议进行了增强,通过一些方式来达到可靠的数据传输
  • UDP:不可靠的数据传输,它只对ip增加了进程到进程之间的通信,其他的就没了,原原本本

TCP套接字编程

        TCP socket反应的是应用进程A和应用进程B会话关系的一个代表,A对对应的socket发送数据,就是A对B发送数据;A对对应的socket接收数据就是对B接收数据。

大致过程

1.服务器进程必须运行,创建一个欢迎socket,该socket和本地的端口进行捆绑,在欢迎socket上阻塞式的等待接收客户端的连接

2.客户端创建本地的套接字,隐式捆绑到本地的端口,再指定服务器的ip和端口进行连接。

3.服务器接受来自用户端的请求 ,解除阻塞式等待,返回一个 新的socket(与欢迎socket不 一样),与客户端通信

4.连接API调用有效时,客户端与服务器建立了TCP连接,即可以通信了

代码如下:

@Test
public void server() throws IOException {
    //1.建立欢迎socket,绑定一个监听的端口号
    ServerSocket welcomeSocket = new ServerSocket(8080);
    //2.阻塞的等待客户端的连接请求,连接请求到来时创建一个新的socket,与客户端绑定
    Socket socket = welcomeSocket.accept();
    //6.从该socket接收数据
    InputStream is = socket.getInputStream();
    int len = 0;
    while ((len = is.read()) != -1) {
        System.out.print((char) len);
    }
    socket.close();
}

@Test
public void client() throws IOException {
    //3.建立一个客户端这边的socket
    Socket socket = new Socket();
    //4.阻塞的请求连接到指定ip和端口号的服务器进程
    socket.connect(new InetSocketAddress("localhost", 8080));
    //5.发送数据到该socket
    OutputStream os = socket.getOutputStream();
    byte[] bytes = new byte[1024];
    os.write("hello".getBytes());
    socket.shutdownOutput();
}

详细过程

首先来看java中socket的结构体(类),其他语言都大同小异。

public abstract class SocketImpl implements SocketOptions {    
    /**
     * The IP address of the remote end of this socket.远程主机的ip地址
     */
    protected InetAddress address;
    /**
     * The port number on the remote host to which this socket is connected.远程主机的端口
     */
    protected int port;
    /**
     * The local port number to which this socket is connected.本地端口
     */
    protected int localport;
    /**
     *实际还有一个本机的ip地址,被省略掉了
     */
}

InetAddress类就不介绍了,里面就是封装了ip地址等信息。

ServerSocket和Socket类是一个东西,只时名字不同而已。具体可以看源码。

可以得出来socket其实大致就是这么一个6元组(这里省略了socket的状态),当我们应用进程创建socket时,操作系统给该socket一个唯一的整数标识,且肯定是要保存是哪个进程创建的socket,所以pid也应该对应起来,方便日后能给找到对应的进程。

 我们举例如下图的一个通信过程来具体的说明socket的通信过程:

1.首先服务器进程先建立一个欢迎socket,用于监听连接请求,并且绑定端口号为8080,阻塞监听客户端的连接请求,如下图

 2.这时候客户端也新建一个socket(该socket以后会当做和服务器的通信socket),这个socket不用像服务器那样绑定一个固定的端口号用于监听,但是操作系统会给该socket绑定一个随机的端口,这里假设是4567。如下图,此时客户端的1号socket还是一个无效的状态,因为还没有连接

3.客户端用刚刚建立的socket和远程服务器进行连接connect,指明服务器的地址和对应的端口号,此时socket的状态也就补齐了,随后客户端进入阻塞模式进行TCP的三次握手,请求和服务器建立连接

 4.服务器和客户端TCP连接建立好后,解除阻塞,并且返回一个新的socket(因为不能占用welcome socket),新的socket就是服务器和客户端的一个连接状态,该socket变为一个有效状态,此时服务器继续进入阻塞状态等待此socket的数据。

5. 连接建立好后,客户端也解除阻塞,它的socket1也变为有效状态。然后客户端把需要发送的数据和对应的socket1(输出流里面封装了socket)交给下层传输层,此时的传输层得到了它相应的信息,根据socket就可以从表中查到需要发送的目的ip和端口,继续交给下层直到发送到服务器。

6.服务器的tcp层收到数据包后,查看源ip、目的ip、源端口、目的端口,一一对照自己的socket表,发现2号socket真好对应,且得知2号socket是pid为100的应用进程,所以tcp把数据发送给该进程,服务器的java进程解除阻塞,read客户端发送来的数据。

7.最后如果服务器和客户端某一方没有数据发了,不想建立连接了,就调用close方法,进行TCP的四次挥手,解除连接,使两边对应的socket都变得无效。

UDP套接字编程

        UDP是没有建立连接这一过程的,也不需要维持会话关系,每个报文都是独立传输的。因此UDP只能使用一个整数来标志当前应用进程,不能够固定住对方的ip和端口号,因为UDP通信前不建立连接,可能现在发的这个ip和端口是一台主机,而下次用同样的ip和端口发的就是另一台主机了。所以每次发送的时候都需要指定发送的目的ip和端口。

UDP的socket大致如下

 java中UDPsocket结构如下

public abstract class DatagramSocketImpl implements SocketOptions {

    /**
     * The local port number.
     */
    protected int localPort;
    /**
     * 省略本机ip
     */
}

UDP简单套接字编程如下:

@Test
public void server() throws IOException {
    //1.创建udp socket,并绑定到本机ip和8080端口号
    DatagramSocket socket = new DatagramSocket(8080);
    byte[] buff = new byte[100];
    //存放数据包的容器
    DatagramPacket packet = new DatagramPacket(buff, 0, buff.length);
    //接收数据包
    socket.receive(packet);
    System.out.println(new String(packet.getData(), 0, packet.getLength()));
    socket.close();
}

@Test
public void client() throws IOException {
    DatagramSocket socket = new DatagramSocket();
    byte[] data = "hello".getBytes();
    //指明发送端的ip和端口和数据部分
    DatagramPacket packet = new DatagramPacket(data, data.length, InetAddress.getByName("127.1.1.1"), 8080);
    //使用该socket发送数据包
    socket.send(packet);
}

详细步骤如下:

1.服务器创建一个udp的socket,绑定端口8080用于监听数据包,通过调用receive方法阻塞的监听。

  2.客户端创建一个自己的socket,该socket的端口假设操作系统分配的是4567

 3.客户端发送数据包、目标ip和目标端口给下层的传输层,传输层就能够得到源ip、源端口、目的ip和目的端口,然后一步一步的打包交给下层,发送到服务器主机,服务器主机通过数据包的目的ip和目的端口,对比发现socket对应,然后把数据发送给对应的pid号为100的应用进程。

4.服务器解除阻塞,收取数据。

5.最后关闭连接,删除对应的socket

注意的是UDP是没有welcome socket的

补充

再补充一个小知识点,那就是端口号和进程的联系

进程pid是否可供计算机之间使用呢?

        应用层代表的就是我们的应用进程,既然进程代表着应用层,那为什么进程pid不能作为应用层的标识来进行计算机之间传输呢?而是使用额外的端口号呢?

(1)首先: 单个计算机中的进程使用pid来标志的,但是在互联网环境下使用的计算机操作系统种类很多,而不同的操作系统又使用不同格式的进程标识符,为了使运行不同操作系统的计算机的应用进程能够互相通信,就必须使用统一的方法对TCP/IP体系的进程进行标识;

(2)其次:一个机器上运行的进程不能成为互联网上通信的最后终点,因为进程的创建和撤销都是动态的,通信的一方几乎无法识别对方机器的进程是哪一个;

例如:要和互联网上某个邮件服务器联系,几乎无法得知其服务器邮件进程的进程标识符,因为进程标识符是随机分配的;所以,我们并不一定要知道这个服务器服务是由目的主机那个进程实现的;

所以,不能使用进程标识符来做计算机之间的进程通信标识;

如何使用端口号进行通信?
   
    两个计算机中进程要互相通信,除了必须指定对方的IP地址,还需要知道对方的端口号;

例如:我们寄信的过程说明,当我们要给某人写信时,除了通讯地址还要有收件人的名字,这里的通讯地址就是IP地址,但是收件人的名字却不是进程标识符,因为有可能这个人用的是法文、德文、英文名字,快递员无法识别,因此采用 “菜鸟驿站" 的模式,为每个地址配备多个快递箱(端口号),快递员只是将包裹放置具体的快递箱(端口号),收件人通过监听某个快递箱是否有快递(TCP或者UDP),来进行数据接收,最终拿到需要的包裹(数据);

端口号如何分配?

        (1)服务器使用的端口号:

        一类为熟知端口号或系统端口号(0~1023),将一些重要的应用程序进行登记,所以将一些端口号固定的分配给它们,以便于让所以的用户的了解,与之建立联系; 

        另一类为登记端口号(1024~49151),为那些不知名的应用程序使用;

        (2)客户机使用的端口号:

        也称为短暂端口号,由于这类端口仅仅在客户进程进行时才动态选择,留给客户进程短暂使用,当通信结束后,刚才使用过的客户端口号不复存在,可以继续供其他客户进程使用;
 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_45902285/article/details/122814167

智能推荐

使用nginx解决浏览器跨域问题_nginx不停的xhr-程序员宅基地

文章浏览阅读1k次。通过使用ajax方法跨域请求是浏览器所不允许的,浏览器出于安全考虑是禁止的。警告信息如下:不过jQuery对跨域问题也有解决方案,使用jsonp的方式解决,方法如下:$.ajax({ async:false, url: 'http://www.mysite.com/demo.do', // 跨域URL ty..._nginx不停的xhr

在 Oracle 中配置 extproc 以访问 ST_Geometry-程序员宅基地

文章浏览阅读2k次。关于在 Oracle 中配置 extproc 以访问 ST_Geometry,也就是我们所说的 使用空间SQL 的方法,官方文档链接如下。http://desktop.arcgis.com/zh-cn/arcmap/latest/manage-data/gdbs-in-oracle/configure-oracle-extproc.htm其实简单总结一下,主要就分为以下几个步骤。..._extproc

Linux C++ gbk转为utf-8_linux c++ gbk->utf8-程序员宅基地

文章浏览阅读1.5w次。linux下没有上面的两个函数,需要使用函数 mbstowcs和wcstombsmbstowcs将多字节编码转换为宽字节编码wcstombs将宽字节编码转换为多字节编码这两个函数,转换过程中受到系统编码类型的影响,需要通过设置来设定转换前和转换后的编码类型。通过函数setlocale进行系统编码的设置。linux下输入命名locale -a查看系统支持的编码_linux c++ gbk->utf8

IMP-00009: 导出文件异常结束-程序员宅基地

文章浏览阅读750次。今天准备从生产库向测试库进行数据导入,结果在imp导入的时候遇到“ IMP-00009:导出文件异常结束” 错误,google一下,发现可能有如下原因导致imp的数据太大,没有写buffer和commit两个数据库字符集不同从低版本exp的dmp文件,向高版本imp导出的dmp文件出错传输dmp文件时,文件损坏解决办法:imp时指定..._imp-00009导出文件异常结束

python程序员需要深入掌握的技能_Python用数据说明程序员需要掌握的技能-程序员宅基地

文章浏览阅读143次。当下是一个大数据的时代,各个行业都离不开数据的支持。因此,网络爬虫就应运而生。网络爬虫当下最为火热的是Python,Python开发爬虫相对简单,而且功能库相当完善,力压众多开发语言。本次教程我们爬取前程无忧的招聘信息来分析Python程序员需要掌握那些编程技术。首先在谷歌浏览器打开前程无忧的首页,按F12打开浏览器的开发者工具。浏览器开发者工具是用于捕捉网站的请求信息,通过分析请求信息可以了解请..._初级python程序员能力要求

Spring @Service生成bean名称的规则(当类的名字是以两个或以上的大写字母开头的话,bean的名字会与类名保持一致)_@service beanname-程序员宅基地

文章浏览阅读7.6k次,点赞2次,收藏6次。@Service标注的bean,类名:ABDemoService查看源码后发现,原来是经过一个特殊处理:当类的名字是以两个或以上的大写字母开头的话,bean的名字会与类名保持一致public class AnnotationBeanNameGenerator implements BeanNameGenerator { private static final String C..._@service beanname

随便推点

二叉树的各种创建方法_二叉树的建立-程序员宅基地

文章浏览阅读6.9w次,点赞73次,收藏463次。1.前序创建#include<stdio.h>#include<string.h>#include<stdlib.h>#include<malloc.h>#include<iostream>#include<stack>#include<queue>using namespace std;typed_二叉树的建立

解决asp.net导出excel时中文文件名乱码_asp.net utf8 导出中文字符乱码-程序员宅基地

文章浏览阅读7.1k次。在Asp.net上使用Excel导出功能,如果文件名出现中文,便会以乱码视之。 解决方法: fileName = HttpUtility.UrlEncode(fileName, System.Text.Encoding.UTF8);_asp.net utf8 导出中文字符乱码

笔记-编译原理-实验一-词法分析器设计_对pl/0作以下修改扩充。增加单词-程序员宅基地

文章浏览阅读2.1k次,点赞4次,收藏23次。第一次实验 词法分析实验报告设计思想词法分析的主要任务是根据文法的词汇表以及对应约定的编码进行一定的识别,找出文件中所有的合法的单词,并给出一定的信息作为最后的结果,用于后续语法分析程序的使用;本实验针对 PL/0 语言 的文法、词汇表编写一个词法分析程序,对于每个单词根据词汇表输出: (单词种类, 单词的值) 二元对。词汇表:种别编码单词符号助记符0beginb..._对pl/0作以下修改扩充。增加单词

android adb shell 权限,android adb shell权限被拒绝-程序员宅基地

文章浏览阅读773次。我在使用adb.exe时遇到了麻烦.我想使用与bash相同的adb.exe shell提示符,所以我决定更改默认的bash二进制文件(当然二进制文件是交叉编译的,一切都很完美)更改bash二进制文件遵循以下顺序> adb remount> adb push bash / system / bin /> adb shell> cd / system / bin> chm..._adb shell mv 权限

投影仪-相机标定_相机-投影仪标定-程序员宅基地

文章浏览阅读6.8k次,点赞12次,收藏125次。1. 单目相机标定引言相机标定已经研究多年,标定的算法可以分为基于摄影测量的标定和自标定。其中,应用最为广泛的还是张正友标定法。这是一种简单灵活、高鲁棒性、低成本的相机标定算法。仅需要一台相机和一块平面标定板构建相机标定系统,在标定过程中,相机拍摄多个角度下(至少两个角度,推荐10~20个角度)的标定板图像(相机和标定板都可以移动),即可对相机的内外参数进行标定。下面介绍张氏标定法(以下也这么称呼)的原理。原理相机模型和单应矩阵相机标定,就是对相机的内外参数进行计算的过程,从而得到物体到图像的投影_相机-投影仪标定

Wayland架构、渲染、硬件支持-程序员宅基地

文章浏览阅读2.2k次。文章目录Wayland 架构Wayland 渲染Wayland的 硬件支持简 述: 翻译一篇关于和 wayland 有关的技术文章, 其英文标题为Wayland Architecture .Wayland 架构若是想要更好的理解 Wayland 架构及其与 X (X11 or X Window System) 结构;一种很好的方法是将事件从输入设备就开始跟踪, 查看期间所有的屏幕上出现的变化。这就是我们现在对 X 的理解。 内核是从一个输入设备中获取一个事件,并通过 evdev 输入_wayland

推荐文章

热门文章

相关标签