EtherSAM (ITU-T Y.1564) - Tiêu chuẩn mới trong đánh giá dịch vụ Ethernet

  1.  Thực trạng của các mạng ngày nay

            Mạng Ethernet hiện đang cung cấp các dịch vụ thời gian thực. Mỗi loại dịch vụ đề cập đến các loại lưu lượng khác nhau mà mạng có thể thực hiện. Nói chung, tất cả lưu lượng mạng có thể được phân loại theo ba loại lưu lượng: best effort, real-time và high-priority. Mỗi loại lưu lượng bị ảnh hưởng khác nhau bởi các đặc tính mạng và phải được chuẩn bị và định hình để đáp ứng các mục tiêu hiệu suất tối thiểu của chúng.

Bảng 1: Các loại lưu lượng mạng

            Để đảm bảo chất lượng dịch vụ (QoS), các nhà cung cấp cần cấu hình đúng cách mạng của họ để xác định cách ưu tiên lưu lượng bên trong. Điều này được thực hiện bằng cách ấn định các mức độ ưu tiên khác nhau cho từng loại dịch vụ và cấu hình chính xác các thuật toán ưu tiên mạng. Thực thi QoS đề cập đến phương pháp được sử dụng để phân biệt lưu lượng của các dịch vụ khác nhau thông qua các trường cụ thể trong khung, do đó ưu tiên khung cho các dịch vụ nhất định hơn các khung khác. Các trường này giúp phần tử mạng có thể phân biệt và phục vụ lưu lượng ưu tiên cao và thấp.

  1. Tầm quan trọng của SLA

Thỏa thuận mức dịch vụ (SLA) là một hợp đồng ràng buộc giữa nhà cung cấp dịch vụ và khách hàng, đảm bảo hiệu suất tối thiểu cho các dịch vụ được cung cấp. Các SLA này chỉ định các đặc điểm chính và hiệu suất tối thiểu được đảm bảo cho từng đặc tính.

Bảng 2: KPI cho các loại lưu lượng truy cập khác nhau

            Lưu lượng truy cập của khách hàng được phân loại thành ba loại lưu lượng và mỗi loại được chỉ định một màu cụ thể: màu xanh lá cây cho lưu lượng đã cam kết, màu vàng cho lưu lượng vượt quá và màu đỏ cho lưu lượng bị loại bỏ.

  • Tốc độ thông tin cam kết (CIR): đề cập đến băng thông được đảm bảo luôn sẵn sàng cho một dịch vụ cụ thể; các KPI được đảm bảo đáp ứng.
  • Tốc độ thông tin vượt mức (EIR): đề cập đến băng thông vượt quá mức CIR có thể khả dụng tùy thuộc vào tải và sử dụng mạng; các KPI không được đảm bảo đáp ứng.
  • Lưu lượng bị loại bỏ: đề cập đến lưu lượng cao hơn tỷ lệ CIR hoặc tỷ lệ CIR/EIR và không thể được chuyển tiếp mà không làm gián đoạn các dịch vụ khác.

Các chỉ số hiệu suất chính

  • Băng thông: Băng thông đề cập đến lượng dữ liệu tối đa có thể được chuyển tiếp. Phép đo này là tỷ lệ của tổng lượng lưu lượng truy cập được chuyển tiếp trong thời lượng đo là một giây.
  • Độ trễ khung: Độ trễ hoặc độ trễ khung là phép đo thời gian trễ giữa quá trình truyền và nhận gói tin.
  • Tỷ lệ mất khung: Mất khung hình có thể xảy ra vì nhiều lý do, chẳng hạn như lỗi đường truyền hoặc tắc nghẽn mạng.
  • Jitter: Là khoảng thời gian chênh lệch giữa gói tin nhận được sớm nhất và muộn nhất.
  1. Hạn chế của RFC 2544 và sự ra đời của ITU-T Y.1564

            Với sự phát triển mạnh mẽ của công nghệ truyền thông và các dịch vụ giá trị gia tăng, công nghệ Ethernet đã được sử dụng để truyền rất nhiều loại dịch vụ khác nhau: dữ liệu của mạng di động 3G, dịch vụ IPTV, VoIP,….

            Khi đó, RFC 2544 đã bộc lộ một số hạn chế cơ bản:

  • RFC-2544 chỉ phát một luồng dữ liệu để kiểm tra nên không thể đánh giá chính xác chất lượng luồng Ethernet đang truyền nhiều loại dịch vụ khác nhau.
  • RFC-2544 chỉ đưa ra kết quả tại một thời điểm (thời điểm hoàn thành bài đo), nên sẽ không phản ánh sự thay đổi đặc tính của đường truyền như trong thực tế.

            Để khắc phục các hạn chế này, ITU-T Y.1564 đã thực hiện đo theo nguyên lý sau:

  • Phát đồng thời nhiều luồng dữ liệu với các độ ưu tiên khác nhau nhằm đánh giá chất lượng của từng loại dịch vụ khi có sự tương tác với các dịch vụ khác.
  • Kết quả đo được hiển thị dưới dạng giá trị lớn nhất/ nhỏ nhất/ trung bình, cho phép kĩ thuật viên nhìn nhận được tính ổn định của đường truyền trong suốt quá trình đo.
  1. Phương pháp đo kiểm EtherSAM (ITU-T Y.1564)

4.1. Kiểm tra cấu hình dịch vụ

            Kiểm tra cấu hình dịch vụ là kiểm tra theo từng dịch vụ để xác minh các yêu cầu về băng thông và hiệu suất của một dịch vụ cụ thể, do người dùng xác định. Quá trình tuân theo ba giai đoạn chính và giám sát tất cả các chỉ số hiệu suất trong các bước này để đảm bảo rằng tất cả chúng đều được đáp ứng cùng một lúc.

4.1.1. Giai đoạn 1: Tốc độ dữ liệu tối thiểu đến CIR

            Trong giai đoạn này, băng thông cho một dịch vụ cụ thể được tăng từ tốc độ dữ liệu tối thiểu lên tốc độ thông tin đã cam kết (CIR). Điều này đảm bảo rằng mạng có thể hỗ trợ dịch vụ cụ thể này ở các tốc độ dữ liệu khác nhau trong khi vẫn duy trì các mức hiệu suất.

            Khi dịch vụ đang dần tăng lên đến CIR, hệ thống sẽ tự động đo lường KPI ở mỗi bước để đảm bảo rằng các mục tiêu hiệu suất tối thiểu luôn được đáp ứng. Để giai đoạn này đạt thì tất cả các mục tiêu hiệu suất phải được đáp ứng ở từng bước cho đến hết CIR.

4.1.2. Giai đoạn 2: CIR đến EIR

Trong giai đoạn này, dịch vụ được tăng từ CIR lên tốc độ thông tin vượt mức (EIR). Điều này đảm bảo rằng EIR của dịch vụ được cấu hình chính xác và tốc độ có thể đạt được. Tuy nhiên, theo các nguyên tắc thì hiệu suất không được đảm bảo trong EIR; do đó không có đánh giá KPI nào được thực hiện. Ở giai đoạn này, hệ thống chỉ giám sát thông lượng nhận được. Vì EIR không được đảm bảo, băng thông có thể không khả dụng cho tất cả lưu lượng trên CIR.

4.1.3. Giai đoạn 3: Kiểm tra lưu lượng

            Trong giai đoạn này, lưu lượng truy cập được gửi trên EIR và tốc độ Rx được theo dõi. Bất kỳ lưu lượng nào vượt quá mức tối đa này nên bị loại bỏ để tránh quá tải mạng. Nếu lưu lượng nhận được vượt quá EIR, điều này có nghĩa là một thiết bị không được cấu hình đúng và tình trạng lỗi sẽ được báo hiệu.

4.1.4. Kiểm tra Burst

            Kiểm tra Burst là một bài kiểm tra phụ trong kiểm tra cấu hình dịch vụ. Mục tiêu của bài kiểm tra này là để xác minh rằng kích thước burst mong đợi có thể được truyền qua thiết bị mạng với suy hao nhỏ nhất. Cấu hình băng thông của thiết bị mạng chứa các thuộc tính về kích thước burst đã cam kết (CBS) và kích thước burst vượt quá (EBS) mà nhà cung cấp dịch vụ nên kiểm tra tại thời điểm kích hoạt dịch vụ để xác minh cấu hình thuộc tính phù hợp.

            Giai đoạn kiểm tra burst gồm 2 phần: CBS và EBS. CBS là số byte được phân bổ có sẵn cho các burst được truyền với tốc độ cao hơn CIR trong khi đáp ứng các yêu cầu SLA. EBS là số byte được phân bổ có sẵn cho các burst được truyền với tốc độ trên CIR+EIR trong khi vẫn duy trì EIR.

Hình 1: Chuỗi kiểm tra burst CBS và EBS

            Bởi vì các thuộc tính CBS và EBS trên thiết bị mạng có thể được định cấu hình khác nhau cho từng hướng dịch vụ, việc kiểm tra CBS và EBS trong cấu hình khứ hồi có rất ít hoặc không có giá trị. Điều cần thiết là các thông số này phải được kiểm tra độc lập cho từng hướng dịch vụ.

            Cùng với kích thước burst CBS và EBS, các thông số chuỗi burst có thể được cấu hình đầy đủ trên dòng NetBlazer và PowerBlazer của EXFO, được thể hiện trong sơ đồ bên dưới.

Hình 2: Cấu hình tham số chuỗi burst

4.2. Kiểm tra hiệu suất dịch vụ

            Trong khi kiểm tra cấu hình dịch vụ tập trung vào cấu hình phù hợp của từng dịch vụ trong các phần tử mạng, kiểm tra hiệu suất dịch vụ tập trung vào việc thực thi các tham số QoS trong các điều kiện đã cam kết.

            Trong thử nghiệm này, tất cả các dịch vụ đã cấu hình được tạo cùng một lúc và tại cùng một CIR trong thời gian có thể từ vài giây đến tối đa là 30 ngày. Trong thời gian này, hiệu suất của từng dịch vụ được giám sát riêng. Nếu bất kỳ dịch vụ nào không đáp ứng được các thông số hiệu suất của nó, một điều kiện không thành công sẽ được báo hiệu.

4.3. Mô hình đo kiểm EtherSAM: Loopback và Bidirectional (Dual Test Set)

            EtherSAM cũng có thể thực hiện các phép đo khứ hồi bằng thiết bị lặp lại. Trong trường hợp này, giá trị đo phản ánh giá trị trung bình của cả hai hướng thử nghiệm, từ vị trí thực hiện đến điểm lặp lại và quay lại vị trí cũ. Trong trường hợp này, chức năng lặp lại có thể được thực hiện bởi một công cụ kiểm tra khác ở chế độ Loopback hoặc bởi một thiết bị giao diện mạng (NID) ở chế độ Loopback.

            Thử nghiệm tương tự cũng có thể được thực hiện ở chế độ Dual Test Set. Trong trường hợp này, hai bộ kiểm tra, một bộ được chỉ định là cục bộ và bộ còn lại là từ xa, được sử dụng để giao tiếp và chạy các bài kiểm tra độc lập đồng thời cho mỗi hướng. Điều này cung cấp kết quả kiểm tra chính xác hơn nhiều, chẳng hạn như đánh giá độc lập cho mỗi hướng và khả năng nhanh chóng xác định hướng nào của liên kết đang gặp sự cố.

            Việc kiểm tra đồng thời các đường dẫn mạng hiện nay theo cả hai hướng là rất quan trọng. Điều này mô phỏng lưu lượng mạng trong đời thực và có thể phát hiện ra các vấn đề về cấu hình thiết bị mạng có thể không bị phát hiện bằng thử nghiệm hai chiều không đồng thời. Hơn nữa, việc thực hiện thử nghiệm hai chiều đồng thời giúp giảm đáng kể chi phí bằng cách giảm thời gian thử nghiệm xuống 50%.

Hình 3: Mô hình đo kiểm Loopback và Bidirectional

  1. Ưu điểm của EtherSAM (ITU-T Y.1564)

5.1. Đo tất cả KPI trong một bài đo duy nhất

            Trong khi các RFC 2544 chỉ cung cấp khả năng đo lường hiệu suất tối đa của một dịch vụ, EtherSAM sử dụng phương pháp xác thực trong đó KPI được đo lường và so sánh với các giá trị mong đợi cho mỗi dịch vụ. Cách tiếp cận này tập trung vào việc chứng minh rằng các KPI được đáp ứng trong điều kiện lưu lượng được đảm bảo.

5.2. Nhanh hơn đáng kể

            Phương pháp RFC 2544 sử dụng phương pháp đo tuần tự, trong đó mỗi thử nghiệm con được thực hiện lần lượt cho đến khi tất cả chúng được hoàn thành, làm cho nó trở thành một thủ tục tốn thời gian. Ngoài ra, việc hoàn thành một subtest phụ thuộc rất nhiều vào chất lượng của liên kết. Nếu nó gặp nhiều sự kiện gây mất khung hình, thời gian kiểm tra sẽ tăng lên đáng kể.

            Ngược lại, EtherSAM sử dụng một cách đo tăng dần, trong đó mỗi bước cần một khoảng thời gian chính xác. Bởi vì điều kiện đạt/ không đạt dựa trên đánh giá KPI trong suốt mỗi bước, các vấn đề về chất lượng liên kết được xác định nhanh chóng mà không làm tăng thời gian kiểm tra. Mỗi bước có thể được cấu hình từ 1 đến 60 giây, với thời gian mặc định là 5 giây. Cách tiếp cận này hiệu quả hơn nhiều, vì nó tạo ra kết quả hợp lệ trong một khoảng thời gian rất ngắn so với thuật toán RFC 2544.

5.3. Khả năng đo kiểm đa dịch vụ

            Như đã mô tả trước đó, phần lớn các dịch vụ Ethernet được triển khai ngày nay bao gồm nhiều lớp dịch vụ trong cùng một kết nối. Ví dụ, các dịch vụ backhaul di động 3G thường bao gồm bốn loại dịch vụ, trong khi backhaul 4G LTE có bảy. Một nhược điểm lớn của RFC 2544 là nó chỉ có thể kiểm tra một dịch vụ duy nhất tại một thời điểm. Điều này ngụ ý rằng kiểm tra RFC 2544 phải được khởi chạy lại cho tất cả các dịch vụ trong quá trình kiểm tra cấu hình. Kết hợp nhu cầu lặp lại thử nghiệm trên mỗi lần phân phối với thời gian cần thiết để hoàn thành một chu kỳ đơn lẻ, RFC 2544 làm tăng thời gian thử nghiệm một cách không hiệu quả.

            Trong khi đó, EtherSAM cung cấp đánh giá nhanh chóng về cấu hình dịch vụ. Điều này làm giảm đáng kể tổng thời gian kiểm tra của nhiều dịch vụ. Trong một kịch bản kiểm tra hiệu suất ba dịch vụ điển hình, tổng kiểm tra RFC 2544 mất khoảng 1 giờ, trong khi đánh giá tương tự với cùng kích thước khung hình sử dụng EtherSAM mất 9 phút.

Hình 6: Thời gian đo của RFC 2544 và EtherSAM với cùng kích thước khung mỗi dịch vụ