Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
jonathan001
V2EX  ›  云计算

公有云负载均衡是如何实现多租户的

  •  
  •   jonathan001 · 20h 29m ago · 1243 views

    我最近在思考一个问题,公有云负载均衡是如何实现多租户,目前我想到的方案有二,具体如下:

    方案一、 负载均衡器直接安装在 VPC 内部以虚拟机的形式存在,这样天然实现了租户隔离,即使 CIDR 重叠也没有关系,但是随着租户越来越多虚拟机数量暴增,资源严重浪费。

    方案二、 共享负载均衡池,部分人共用一个 nginx 进程,每个租户分配一个虚拟的 ip 地址,负载均衡器 proxy_pass 指向这个虚拟的 IP ,然后通过 NAT 进行转换引流到 VPC 中,但是缺点是 NAT 需要跟踪这些 SESSION ,表象过大。

    不知道有没有做过的童鞋,给提提意见。

    17 replies    2026-05-17 11:22:13 +08:00
    PolarBears
        1
    PolarBears  
       20h 17m ago
    除了虚拟机其实还有 LXC 这种东西
    jonathan001
        2
    jonathan001  
    OP
       20h 9m ago
    @PolarBears 只是隔离环境,我在想是不是可以用 LXC 然后流量出的时候直接打上 vlan ,然后上层交换机引入 vxlan
    pingdog
        3
    pingdog  
       19h 59m ago via iPhone
    vxlan 解决不了多租户,vrf, sr 都发展十多年了

    Linux 还可以用 netns 来分割多个 instance
    jonathan001
        4
    jonathan001  
    OP
       19h 55m ago
    @pingdog 我刚才看了下,可以把不同租户的 nginx 进程放到 netns 中,网络一端在 ns 中,一端在物理机,物理机器这段要通过 vrf 隔离,按理说可以实现多租户的隔离。
    teaguexiao
        5
    teaguexiao  
       18h 52m ago
    AWS ALB/NLB 实際上是方案二的变体,共享池配路,内部用 VPC Lattice 和 Hyperplane 做网络虚拟化而不是传统 NAT ,避免了连接跟踪表爆峸的问题。跟你方案二思路相近,但关键在网络中面痄呼而不是 instance 层就能打通租户隔离。
    jonathan001
        6
    jonathan001  
    OP
       18h 36m ago
    @teaguexiao 我看公开的资料少,就自己瞎琢磨
    my3157
        7
    my3157  
       16h 35m ago via Android
    其实大多数云都是有个特殊的网络优化过的物理机,然后上面跑 lxc/vm ,运行 nginx+lua or haproxy
    jonathan001
        8
    jonathan001  
    OP
       16h 26m ago
    @my3157 这种方案我已经梳理通了,直接在 linux netns 中跑 nginx 进程,物理一层的网卡直接放到 vrf 中,netns 中的 nginx 进程应该可以用 cgroup 来做隔离,对于高可用可以在多个可用区部署多个进程,然后归属同一个 vxlan 就行。
    defunct9
        9
    defunct9  
       5h 50m ago via iPhone
    原始的 clb 应该是 f5 ,现在的 alb 应该是 nginx 或者 haproxy 或者 traefik 或者 caddy
    thereone
        10
    thereone  
       3h 0m ago
    多租户的实现,别的不清楚就我接触到的是物理设备和 NFV 设备。普通型是使用负载均衡的虚拟机优享型和专用是直接使用物理设备。厂商专用的 NFV 和物理设备都是内部就支持多租户隔离不需要额外做什么。F5 的 Bigve 和高性能物理硬件 华三硬件 LB 还有虚拟机型 LB 以及其它厂家的硬件和软件等等。至于引流底层都是 vxlan 封装至于数据卸载可以是在 tor 交换机也可以在设备内部。
    jonathan001
        11
    jonathan001  
    OP
       2h 32m ago
    @thereone 没有接触过这种设备,但是我感觉 vpc 直接部署虚拟机还是非常简单的。
    thereone
        12
    thereone  
       2h 17m ago
    @jonathan001 vpc 部署虚拟机一般是云上客户自己做,省钱买几台虚拟机自己做成 LB 用 nginx 也好 LVS 别的也好来实现。真正云厂家底层都是用专门的 NFV 或者高性能物理硬件这个才能承载众多用户量。毕竟这些厂家都是专门做这个的性能方面基本不用担心,ASIC FPGA 的硬件转发可以把性能和承载的租户拉到非常高。NFV 也是底层是用 VPP 或者 DPDK 实现高性能的。在要不就是云厂家购买白盒设备自己做自研。
    fovecifer
        13
    fovecifer  
       2h 16m ago
    公有云负载均衡也分不同层次,常用的是 TCP 层和 http/https 层的,我认为肯定要上网络虚拟化的设备,LZ 你说的应该更靠近操作系统层面
    jonathan001
        14
    jonathan001  
    OP
       1h 52m ago
    @thereone 据我所知好多都是基于 dpdk 自己研发的,还有使用 haproxy 二次开发的
    jonathan001
        15
    jonathan001  
    OP
       1h 51m ago
    @fovecifer 我看这方面资料太少了。
    thereone
        16
    thereone  
       1h 46m ago
    @jonathan001 DPDK/VPP 是一般是在通用服务器上面做,还有就是白盒 P4 可编程这种。就说这么多不懂就多去搜搜看看。
    jonathan001
        17
    jonathan001  
    OP
       1h 31m ago
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3031 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 50ms · UTC 04:53 · PVG 12:53 · LAX 21:53 · JFK 00:53
    ♥ Do have faith in what you're doing.