Euclidean norm là gì

Hàm metric hoặc distance là một hàm d [ x, y ], xác lập khoảng cách giữa những thành phần của một tập hợp là một số thực không âm. Nếu khoảng cách bằng 0, thì cả hai yếu tố đều tương tự theo chỉ số đơn cử đó. Do đó, những hàm khoảng cách cung ứng một cách để đo mức độ gần của hai thành phần, trong đó những thành phần không nhất thiết phải là số mà còn hoàn toàn có thể là vectơ, ma trận hoặc đối tượng người dùng tùy ý. Các hàm khoảng cách thường được sử dụng như những hàm lỗi hoặc ngân sách cần được giảm thiểu trong một bài toán tối ưu hóa Chúng ta thường nghe nói đến việc sử dụng những thước đo khoảng cách trong những Thuật toán ML có giám sát như K Nearest Neighbor và những Thuật toán ML không giám sát như phân cụm .
Chương trình chính của thước đo khoảng cách là chỉ ra rằng nếu hai điểm p1 và p2 trong khoảng trống n chiều nằm gần nhau theo thước đo khoảng cách được sử dụng, thì hai điểm hoàn toàn có thể tựa như nhau .

1 Khoảng cách Euclide: Khi chúng ta nói về khoảng cách trước đó, chúng ta chủ yếu nghĩ về khoảng cách theo một đường thẳng nhiều hay ít.

Nếu chúng ta nghĩ về khoảng cách giữa hai thành phố, chúng ta nghĩ về việc chúng ta phải lái xe bao nhiêu km trên đường cao tốc.

Bạn đang đọc: Các loại khoảng cách khác nhau được sử dụng trong học máy

Những ví dụ về khoảng cách mà tất cả chúng ta hoàn toàn có thể nghĩ đến là những ví dụ về khoảng cách Euclide. Về cơ bản, nó đo độ dài của một đoạn nối hai điểm. Hãy xem điều này trong một biểu đồ :

Đối với n điểm, công thức chung như sau :

Trong đó x và y là hai vectơ .

Khoảng cách Euclide là khoảng cách được sử dụng thông dụng nhất cho những thuật toán học máy. Nó rất có ích khi tài liệu của chúng tôi liên tục. Nó còn được gọi là L2-Norm .

2 Khoảng cách Manhattan: Chức năng Khoảng cách Manhattan tính toán khoảng cách đã di chuyển nếu một đường giống như lưới được thực hiện, để đi từ điểm dữ liệu này đến điểm dữ liệu khác. Khoảng cách giữa hai đối tượng trong phương trình Manhattan là tổng các biến thể giữa các thành phần tương ứng của chúng.

Dưới đây là công thức cho Khoảng cách Manhattan :

trong đó, n- số biến, xiyi lần lượt là các biến của vectơ x và y, trong không gian vectơ hai chiều. tức là x = [x1, x2, x3,…]y = [y1, y2, y3,…] .

Bây giờ khoảng cách d sẽ được tính là-

[x1 – y1] + [x2 – y2] + [x3 – y3] +… + [xn – yn] .

Nếu bạn cố gắng nỗ lực tưởng tượng phép tính khoảng cách, nó sẽ giống như dưới đây :

Khoảng cách Manhattan còn được gọi là Hình học Taxicab, Khoảng cách Khối Thành phố, v.v. Bây giờ câu hỏi đặt ra là tại sao tất cả chúng ta lại sử dụng khoảng cách Manhattan trên khoảng cách Euclid ? Vâng, câu vấn đáp rất đơn thuần Việc sử dụng khoảng cách Manhattan phụ thuộc vào rất nhiều vào loại mạng lưới hệ thống tọa độ mà tập tài liệu của bạn đang sử dụng. Trong khi khoảng cách Euclidean cho khoảng cách ngắn nhất hoặc tối thiểu giữa hai điểm, Manhattan có những cách tiến hành đơn cử . Ví dụ, nếu tất cả chúng ta sử dụng tập dữ liệu Cờ vua, thì việc sử dụng khoảng cách Manhattan thích hợp hơn khoảng cách Euclide. Một cách sử dụng khác sẽ là khi chăm sóc đến việc biết khoảng cách giữa những ngôi nhà cách nhau vài dãy nhà . Ngoài ra, bạn hoàn toàn có thể muốn xem xét khoảng cách Manhattan nếu những biến nguồn vào không giống nhau về kiểu [ ví dụ điển hình như tuổi, giới tính, độ cao, v.v. ]. Do lời nguyền về kích cỡ, tất cả chúng ta biết rằng khoảng cách Euclide trở thành một lựa chọn tồi khi số lượng chiều tăng lên .

Nhưng người ta cũng sẽ gặp yếu tố đó nếu sử dụng khoảng cách Manhattan [ chỉ là yếu tố sẽ được giảm nhẹ vì tất cả chúng ta không bình phương sự độc lạ như tất cả chúng ta làm với khoảng cách Euclide ] .

Điển hình là sử dụng hệ mét Euclide; Manhattan có thể thích hợp nếu các kích thước khác nhau không thể so sánh được.

3 Độ tương tự Cosine và Khoảng cách Cosine: Số liệu này được sử dụng nhiều trong các hệ thống khuyến nghị. Trong hệ thống đo lường cosin, chúng tôi đo mức độ góc giữa hai tài liệu / vectơ [thuật ngữ tần số trong các tài liệu khác nhau được thu thập làm số liệu]. Số liệu cụ thể này được sử dụng khi độ lớn giữa các vectơ không quan trọng ngoài định hướng.

Công thức tương tự như cosine hoàn toàn có thể được suy ra từ phương trình của những tích chấm : –

Ý tưởng cơ bản đằng sau sự tương tự cosine và khoảng cách cosine là nếu khoảng cách cosine tăng lên thì sự tương tự cosine sẽ giảm và ngược lại.

Xem thêm: Nắm vững cách hạch toán tài khoản 811 – Chi phí khác

Cosine_distance = 1 - cosine_similarity

Chúng ta hãy hiểu nguyên tắc hoạt động giải trí của mạng lưới hệ thống khuyến nghị trên cơ sở tương tự như cosin. Có hai đối tượng người tiêu dùng địa lý dọc theo trục x và y Giả sử tất cả chúng ta cần đưa ra đề xuất kiến nghị cho điểm v [ d3 ]. Hệ thống yêu cầu sẽ thống kê giám sát độ tương đương cosin theo toàn bộ những điểm khác có trong biểu đồ và điểm có cosin cực đại sự tựa như sẽ được khuyến nghị [ trong trường hợp này là v [ d2 ] ] . Do đó, nó là một phán đoán về xu thế chứ không phải độ lớn : hai vectơ cùng hướng có độ tương tự như cosin là 1, hai vectơ tại 90 ° có độ giống nhau là 0, và hai vectơ đối nhau có đường kính tương tự như là – 1, không nhờ vào vào chúng. độ lớn .

Tương tự cosine đặc biệt quan trọng được sử dụng trong khoảng trống dương, nơi hiệu quả được số lượng giới hạn ngăn nắp trong [ 0,1 ]. Một trong những nguyên do lý giải sự thông dụng của tính tương tự như cosin là nó rất hiệu suất cao để nhìn nhận, đặc biệt quan trọng là so với những vectơ thưa thớt .

4 Khoảng cách Minkowski: Trước hết, chúng ta sẽ định nghĩa một số thuật ngữ toán học để xác định khoảng cách Minkowski sau đó.

  • Một không gian véc tơ là một bộ sưu tập của các đối tượng được gọi là vectơ có thể được thêm vào với nhau và nhân với số [còn gọi là vô hướng ].
  • Một tiêu chuẩn là một chức năng mà chỉ định một chiều dài nghiêm chỉnh tích cực cho mỗi vector trong một không gian vector [Ngoại lệ duy nhất là vector zero mà chiều dài là zero]. Nó thường được biểu diễn là ∥x∥.
  • Một không gian định chuẩn là một không gian véc tơ trên trường số thực hoặc phức tạp mà một chuẩn mực được định nghĩa.

Khoảng cách Minkowski được định nghĩa là thước đo độ giống nhau giữa hai điểm trong khoảng trống vectơ chuẩn [ khoảng trống thực N-chiều ] . Nó cũng đại diện thay mặt cho một số liệu tổng quát gồm có khoảng cách Euclidean và Manhattan . Công thức như thế nào ?


Nếu tất cả chúng ta chú ý quan tâm khi λ = 1, tất cả chúng ta có khoảng cách Manhattan. Nếu λ = 2, tất cả chúng ta có khoảng cách Euclide. Có một khoảng cách khác được gọi là khoảng cách Chebyshev xảy ra khi λ = ∞ . Nhìn chung, tất cả chúng ta hoàn toàn có thể biến hóa giá trị của λ để tính khoảng cách giữa hai điểm theo nhiều cách .

Khi nào tất cả chúng ta sử dụng nó ? Khoảng cách Minkowski thường được sử dụng khi những biến chăm sóc được đo trên thang tỷ suất với giá trị không tuyệt đối .

Định mức L1:

Còn được gọi là Khoảng cách Manhattan hoặc Định mức Taxicab [ khi λ = 1 ]. L1 Norm là tổng độ lớn của những vectơ trong một khoảng trống. Đó là cách tự nhiên nhất để đo khoảng cách giữa những vectơ, đó là tổng chênh lệch tuyệt đối của những thành phần của những vectơ. Trong định mức này, tổng thể những thành phần của vectơ có trọng số như nhau .

Định mức L2:

Là định mức thông dụng nhất, còn được gọi là định mức Ơclit [ khi λ = 2 ]. Đó là khoảng cách ngắn nhất để đi từ điểm này đến điểm khác. Có một điều cần xem xét với định mức L2, đó là mỗi thành phần của vectơ là bình phương, và điều đó có nghĩa là những giá trị ngoại lai có nhiều trọng số hơn, thế cho nên nó hoàn toàn có thể làm xô lệch hiệu quả .

Định mức vô cực L:

Cung cấp độ lớn lớn nhất trong số mỗi thành phần của vectơ [ khi λ = vô cực ] Có vectơ X = [ – 6, 4, 2 ], chuẩn L-vô cùng là 6 .

Trong định mức L-infinity, chỉ thành phần lớn nhất mới có công dụng. Vì vậy, ví dụ : nếu vectơ của bạn đại diện thay mặt cho ngân sách kiến thiết xây dựng một tòa nhà, bằng cách giảm thiểu định mức L-infinity, chúng tôi đang giảm ngân sách của tòa nhà đắt nhất

5 Khoảng cách Hamming: Khoảng cách Hamming so sánh mọi chữ cái của hai chuỗi dựa trên vị trí. Vì vậy, chữ cái đầu tiên của từ 1 được so sánh với chữ cái đầu tiên của từ 2, v.v.

Khoảng cách Hamming so sánh mọi chữ cái của hai chuỗi hoàn toàn dựa trên vị trí.

Xem thêm: Call Là Gì – Call Nghĩa Là Gì Trong Tiếng Anh

Để thống kê giám sát khoảng cách Hamming giữa hai chuỗi, bạn so sánh những ký tự của từng vị trí trong chuỗi. Số ký tự không bằng nhau là khoảng cách Hamming .

Một lợi thế của Khoảng cách Hamming là việc so sánh vị trí này diễn ra rất nhanh gọn và đơn thuần. Mặt khác, những nhà phê bình cho rằng nó không hề tính đến hai chuỗi với số lượng vần âm không bằng nhau. Một nhà phê bình khác cho rằng nó quá khắc nghiệt, ví dụ, “ abcdefg ” và “ bcdefgh ” được coi là trọn vẹn khác nhau, trong khi 6 trên 7 ký tự giống nhau .

Source: //giarepro.com
Category: Hỏi đáp

Video liên quan

Chủ Đề