Metryka probabilistyczna
Z Wikipedii
Metryka probabilistyczna to funkcja definiująca odległość pomiędzy zmiennymi bądź wektorami losowymi.
Spis treści |
[edytuj] Metryka probabilistyczna zmiennych losowych
Metrykę probabilistyczną D pomiędzy dwiema zmiennymi losowymi X i Y można zdefiniować jako:
,
gdzie F(x, y) oznacza łączną gęstość prawdopodobieństwa zmiennych losowych X i Y. Oczywiście jeżeli X i Y są od siebie niezależne, powyższe równanie przechodzi w:
gdzie f(x) i g(y) oznaczają odpowiednie funkcje gęstości prawdopodobieństwa zmiennych X i Y.
Można wykazać, że taka metryka probabilistyczna nie spełnia pierwszego warunku metryki, lub też spełnia go wtedy i tylko wtedy, jeżeli oba jej argumenty to zmienne pewne opisywane funkcją gęstości prawdopodobieństwa typu delty Diraca. W takim przypadku:
metryka probabilistyczna zwyczajnie przechodzi w metrykę pomiędzy wartościami średnimis μx, μy zmiennych X i Y i oczywiście:
.
We wszystkich pozostałych przypadkach:

[edytuj] Przykład: ciągłe zmienne losowe o rozkładzie normalnym (NN)
Jeżeli oba rozkłady zmiennych losowych X i Y to rozkłady normalne (N) o tym samym odchyleniu standardowym σ, całkowanie prowadzi do:
gdzie:
,
a jest uzupełniająca funkcją błędu.
W tym przypadku "wartość zerowa" metryki DNN(X,Y) wynosi:
[edytuj] Przykład: ciągłe zmienne losowe o rozkładzie jednorodnym (RR)
Gdy obie zmienne X and Y określa rozkład jednostajny (R) o tym samym odchyleniu standardowym σ, całkowanie prowadzi do:
Minimalna wartość metryki probabilistycznej tego typu wynosi:
.
[edytuj] Metryka probabilistyczna wektorów losowych
Metrykę probabilistyczną zmiennych losowych można rozszerzyć na metrykę D(X, Y) wektorów losowych X, Y podstawiając w miejsce | x − y | dowolny operator metryki d(x,y):
gdzie F(X, Y) oznacza łączną gęstość prawdopodobieństwa wektorów losowych X and Y. Na przykład podstawiając w miejsce d(x,y) metrykę euklidesową i przy założeniu, że wektory X i Y są wzajemnie niezależne otrzymamy:
gdzie i
to wielowymiarowe rozkłady gęstości prawdopodobieństwa wektorów np. wielowymiarowe rozkłady normalne.
[edytuj] Metryka probabilistyczna wektorów losowych - forma euklidesowa
Jeżeli wektory X i Y są nie tylko wzajemnie niezależne, ale także poszczególne składowe każdego z nich są statystycznie niezależne, metrykę probabilistyczną wektorów losowych można także zdefiniować jako:
gdzie:
- D * * (Xi,Yi)
jest szczególną formą metryki probabilistycznej zmiennych losowych dobraną w zależności od rozkładów poszczególnych składowych Xi, Yi wektorów X, Y.