Probabilitatea – știm despre ce vorbim?

Despre ce e vorba

Sub titlul „De ce nu știm despre ce vorbim când vorbim despre probabilitate”, N. N. Taleb explică problemele puse în discuție când vorbim despre probabilități și despre câștigurile așteptate în prezența efectelor convexității și arată cum:

  1. dinamica expunerii este separată de cea a probabilității și
  2. cum probabilitatea trebuie utilizată ca un nucleu și nu ca un rezultat final.

Afișează diferența dintre naiv probabilitate în discuțiile filosofice și alte nucleu probabilitate. Explică diferența dintre „cunoaștere” și „a face”, respectiv dintre abordarea „aristoteliană” și cea „thalesiană”. Urmând logica ne conduce la eroarea centrală constatată la Fukushima.

Introducere în problematică

Probabilitatea este un termen prea primitiv în discutarea problemelor

În Fouled by Randomness (Taleb, 2001/2005), personajul este întrebat care scenariu ar fi mai probabil, ca piața să meargă în creștere sau în scădere până la sfârșitul lunii. În creștere, a spus el, mult mai probabil. Dar apoi, tot el a arătat că face pariuri că piață va merge în jos. Acest lucru, desigur, pare a fi paradoxal pentru nonprobabilist, dar foarte obișnuit pentru comercianți (da, piața este mai susceptibilă de a crește, dar ea ar trebui să scadă mult mai mult) și evident în formă probabilistică, pentru S prețul pieței în perioada t nu e nimic incompatibil între P{[S_{t+1}}>S_t] și E{[S_{t+1}}<S_t], (unde E este așteptarea), atunci când se ia în considerare distribuția completă pentru S_{t+1}, ceea ce ar arăta cât de mult este mult mai mică decât media (sub asimetria negativă a distribuției). Aceasta arată una dintre greșelile foarte elementare ale vorbirii despre probabilitate, dar când intrăm mai adânc în subiect, apar, paradoxal, multe probleme mai puțin evidente sau mai puțin cunoscute. Pur și simplu, din perspectiva autorului, nu este riguros să vorbim despre „probabilitate” ca produs final sau chiar ca „bază” a deciziilor. Să mergem mai adânc.

Expunerile contează mai mult, mult mai mult, decât cunoașterea

Expunere, nu cunoaștere. Prima problemă este după cum urmează. Fie  X o variabilă aleatorie sau nealeatorie și F(X) expunerea, plata, efectul lui X pentru tine, sfârșitul liniei. (Pentru a fi tehnic, X este de mari dimensiuni, în \Re^N, dar o asumăm mai mică de dragul exemplelor introductive ca pe o variabilă simplă unidimensională).

Exemple:

  • X este arsenic, cafea sau aspirină, F(X) este răspunsul corpului dumneavoastră la ingerarea de arsenic, cafea sau aspirină (evident răspunsul la doză este neliniar).
  • X poate fi un șoc al lovirii unei cești de cafea, F(X) este răspunsul la schimbarea în valoare a ceștii de cafea și a utilității ei pentru dumneavoastră.
  • X este o „predicție”, F(X) este modul în care mă afectează.
  • X poate fi ploaie, F(X) este efectul ploii asupra mea.
  • X este șomajul în Senegal, F_1(X) este efectul asupra liniei inferioare a IMF și F_2(X) este efectul asupra bunicii tale (pe care-I asum ca minimal).
  • X poate fi un preț al acțiunii, dar dețineți o opțiune asupra ei, deci F(X) este expunerea dvs. la valoarea opțiunii pentru X, sau, chiar mai complicat, utilitatea expunerii la valoarea opțiunii.
  • X poate fi schimbarea în bogăție, F(X) valoarea funcției convex-concavă a lui Kahneman-Tversky, modul în care acestea vă „afectează”

Toate utilitățile sunt încorporate F.

Limite ale cunoașterii. Ceea ce este crucial, limitările noastre în cunoaștere se aplică lui X nu neapărat lui F(X). Nu avem niciun control asupra lui X, ceva control asupra lui F(X). În unele cazuri, un control foarte, foarte mare asupra lui F(X).

Deconectarea. În calitate de practicant și responsabil cu riscul, îmi dau seama de deconectare: oamenii (non-practicienii) vorbesc cu mine despre X (cu implicația că nouă, practicienilor ar trebui să ne pese de X în conducerea afacerilor noastre), în timp ce eu mă gândesc la F(X), nimic altceva decât FX).

Există un număr infinit de funcții F în funcție de o variabilă unică X.

Ideea mea este că nu ar trebui să confundăm „cunoașterea” lui X cu F(X), efectul plății, o eroare adesea făcută, de fapt, aproape întotdeauna făcută. Și „cunoașterea lui X” nu se traduce greșit în cunoașterea lui F(X); F(X) este pachetul complet, începutul și sfârșitul pachetului. F(X) trebuie să fie calculată într-o manieră complet diferită, după cum vom vedea, folosind toate valorile posibile ale lui X. Chestia asta pare naivă, dar oamenii o fac, se pierde ceva în traducere.

  • Iritarea mea cu tratarea problemei Lebedei Negre este după cum urmează: oamenii se concentrează pe X („prezicerea lui X”). Din punctul meu de vedere, deși nu-l înțelegem pe X, îl putem înțelege lucrând F, pe care îl putem înțelege, în timp ce alții lucrează la predicția lui X, ceea ce nu poate fi făcut, deoarece probabilitățile mici sunt necalculabile, în special în domeniile „cozilor groase” (fat tailed). F(X) este modul în care rezultatul final vă afectează.
  • Distribuția probabilității lui F(X) este semnificativ diferită de cea a lui X, în special atunci când F(X) este neliniar. Avem nevoie de o transformare neliniară a distribuției lui X pentru a obține F(X). A trebuit să așteptăm până în 1964 pentru a obține o lucrare despre „transformările convexe ale variabilelor aleatoare“, Van Zwet (1964).

Punctul central despre ce să înțelegem: Când F(X) este convexă, spunem că la încercare-eroare, sau cu o opțiune, nu trebuie să înțelegem X la fel de mult ca expunerea noastră la H. Pur și simplu, proprietățile statistice ale lui X sunt inundate de cele ale lui H. Asta este punctul de Antifragilitate în care expunerea este mai importantă decât noțiunea naivă de „cunoaștere”, adică înțelegerea lui X.

Fragilitate și Antifragilitate:

  • Când F(X) este concav (fragil), erorile despre X se pot traduce în valori negative extreme pentru [latexF[/latex]. Când F(X) este convexă, una este imună la variații negative.
  • Cu cât F este mai neliniară, cu atât probabilitățile lui X contează mai puțin în distribuția probabilității pachetului F final.
  • Majoritatea oamenilor confundă probabilitatea lui X cu cea a lui F. Serios: întreaga literatură se sprijină în mare parte pe această greșeală.

Deci, ignorați acum discuțiile despre X care nu au F. Și, pentru numele lui Baal, concentrează-te pe F, nu pe X.

Probabilitatea și deciziile nu pot fi naiv extrase una din cealaltă

A doua problemă asociată este următoarea. Din fericire, nu folosim probabilități în deciziile zilnice (și mai puțin zilnice), cel puțin nu în formularul brut prezentat în literatură. Probabilitatea pare să fie prezentă doar în manuale (chiar și atunci, adesea în forme greșite și naive). Și asta, dintr-un motiv: probabilitățile sunt o intrare brutală și distorsionată care nu poate fi izolată naiv și extrasă matematic din contextul său și F, pachetul de plăți reprezentat.

Deci deciziile nu ar trebui să se bazeze pe aceste probabilități singulare crude, pe care eu le numesc „probabilități brute” – trebuie să folosească o valoare dublă a câștigului și erori de probabilitate, indiferent de afirmația făcută – cu excepția cazului în care probabilitățile sunt considerate atât singulare, cât și a priori, care nu sunt supuse schimbării. (Nici nu ar trebui să discutăm probabilități unice ca „puncte de plecare”, deoarece acestea nu se generalizează. Din cauza neliniarității efectelor, aceste afirmații sunt, de obicei, reduceri ale paturilor procustiene.)

Așadar, prima eroare gravă este de a vorbi despre probabilitățile „brute”, cu implicația că acestea duc la decizii în afara contextelor „ludice” (precum cazinourile, biletele de loterie și chestiuni care sunt construite și tind să se limiteze la manuale și destul de absente din viața reală). O probabilitate brută este o reducere a estimației punctului de tipul „5% șanse de ploaie” sau „5% șanse de război” etc., care discretizează evenimentul și îl exprimă folosind un număr mai degrabă decât o distribuție completă (discret pe mai multe numere sau densități continue de utilizare). Aceste probabilități brute sunt plăcute, însă „efectul” diferitelor niveluri de ploaie sau de război sunt luate în considerare, iar variațiile în ceea ce privește cantitatea de ploaie, gravitatea războiului etc., efectele variază, deoarece acestea trebuie calculate din interiorul integralei. (Condiția în care transformarea acestor evenimente de mai multe straturi și efecte într-un eveniment unic este: liniaritatea completă a plății în toate valorile variabilei aleatoare).

Această primă eroare este bine cunoscută în rândul experților și practicanților de probabilitate, deși, în mod obișnuit, făcute de economiști care discută piețele și setările „pariurilor” (sau „Value at Risk”), iar filozofii discută „filosofia probabilității” (din ceea ce văd în literatură, în special Hacking, 1984, Hajek, 2010). Ironia este că în timp ce mulți iau milioane de decizii fără probabilitate explicită în ecologia lor naturală, ei nu reușesc să-și dea seama că, atunci când vine vorba de literatură, tendința este să se concentreze pe exemple și concepte legate de „loterii” și lucruri similare care nu seamănă cu ecologia lumii reale, deoarece este unul dintre cazurile rare (construite) de probabilități cu un singur eveniment. Se pare că oamenii sunt mult mai inteligenți cu probabilitate atunci când nu vorbesc despre asta.

Exemplu: întrebați orice filosof care se ocupă de probabilitate, de câte ori a folosit probabilitatea la luarea unei decizii asupra vieții sale, care ar trebui să includă în mod miliarde de decizii mici. Singurele răspunsuri pe care le primesc de obicei sunt exemplele de loterie. Oamenii pot încorpora nucleul de probabilitate în deciziile lor, dar F este dominant (Taleb, 2012) – aceasta este similară cu o „proprietate emergentă” rezultând din neliniarități.

A doua și a treia eroare sunt mult mai grave, au fost în mare parte ratate în literatură și se află în spatele erorilor care cauzează efectele Lebedei Negre: ele sunt rezultatul lipsei integrării (literalmente) a variațiilor, a erorilor de model și a dificultăților în derivarea probabilităților însăși – probabilitățile nu cad din cer și trebuie să încorporăm incertitudini despre ele. Aceste incertitudini nu sunt triviale și afectează probabilitățile mici și, în consecință, plățile lor în moduri grave.

Probabilități „crude” și plăți anticipate, definiții și prima absurditate

Probabilitatea crudă: deci, dacă X este variabila aleatoare, prima eroare ar fi să luăm (ca în manuale) ceea ce am numit mai devreme „probabilitate brută” (cu uzuala „tripletă” unde p este măsura, etc., într-un interval Dx care pot fi selectate în orice mod posibil pe \sigma-Algebra):

\displaystyle \mathstrut P_{raw}=\int_{Dx}p(x)dx

unde, de fapt, trebuie să luăm în considerare „plata”, care poate fi neliniară (de fapt, ar trebui să fie, cu rarele excepții neliniare). Plata poate fi o funcție F(X) (care include efecte contractuale, preferințe și utilități), care este standard în literatură de la Luce și Raiffa (1958).

Rata preconizată de plată: deci, prima concluzie naivă este ceea ce noi numim „așteptare brută”, cea care face diferența în situațiile de discontinuități și ne-linearități pentru H:

\displaystyle \mathstrut EP_{raw}= \int_{Dx}F(X)p(x)dx

Deci, naiv, liniarul F(X)=x în situația în care EP_{raw} ar fi așteptarea standard peste Dx. Și ceva de genul H(x)=(x-k)^{+} (unde k este o valoare „lovitură”), este o situație de opționalitate explicită, sau introducerea utilității standard ar da U(x).

Prima falsitate: luarea unei decizii bazate pe P_{raw} sau discutarea P_{raw} ca ceva care poate duce la decizii sau la „construirea blocului” de probabilități decât ca divertisment. Vedem că P_{raw} înmulțită cu unii scalari (lucru ce corespunde unui tip de câștig) nu se traduce direct în EP_{raw}. Sub convexitatea lui F, EP_{raw} nu se poate deduce trivial din P_{raw}. Aceasta este problema Thales/Aristotel Antifragil, Taleb (2012a), în care performanța lui Thales provine de la tipul de pariu pe care l-a făcut (aici HH), nu din cunoștințele sale despre șansele evenimentului (PP), dar este atribuit de Aristotel înțelegerii șanselor.

Irelevanța probabilității. De exemplu, inversarea probabilității nu duce neapărat la o inversare a deciziei (sau la plata anticipată); adesea, din contră. De exemplu, cineva poate avea cu ușurință {P_1>P_2}, cu EP_1<EP_2, în ciuda faptului că au aceeași expunere de prim ordin, \displaystyle \mathstrut \frac{\partial{F_1}}{\partial{x}}=\frac{\partial{F_2}}{\partial{x}} arătând că în cazul în care H_1 a fost mai convex decât H_2 (spune că \displaystyle \mathstrut \frac{\partial{F_1}}{\partial{x}}>\frac{\partial{F_2}}{\partial{x}} pentru toate valorile lui x). În acest caz, EP_2 este mai mult afectată de „cozi” și este mai interesată de valori mai mari ale lui x, de efectele de ordinul doi.

Importanța punctului. În afară de problema lui Aristotel-Thales, greșeala este văzută în întreaga utilizare nativă a probabilității și impregnează textele în filosofia probabilității. Probabilitatea nu este un produs final și nu este materia primă care poate fi folosită naiv pe post de „ridicare de blocuri” sau de „fundație”.

Fundația sau „ridicarea blocului” este F[X] p(x), nimic altceva.

Exemplu de astfel de greșeli în finanțe: Valoarea-la-risc (Value-at-Risk) este definită ca găsirea lui s cum ar fi P(\Delta W(s)>VaR)=p,  unde p e probabilitatea (de obicei 99%), \Delta W – schimbările în bogăție, s – variabila de stare sau vector, iar „VaR” este valoarea pe care nu dorim să o pierdem la nivelul de încredere de 99%, „Value at risk”. Problema este, desigur, că pierderea așteptată este condiționată de \Delta W(s)<VaR poate fi (și de obicei este) monstruos de mare.

Experiența autorului: Există o diferență între pachetele în stil „digital” (mai mult ca un pariu De Finetti, P[X>k]) probabilistă pură și pachetele care necesită „distribuție completă”. Deseori, creșterea valorii „digitale” este însoțită de o scădere a valorii E[X|_{x>k}]. Vezi Dynamic Hedging, Taleb (1997).

Eroare în De Finetti. De Finetti, în magistrala La Prévision, se concentrează asupra predicției de la o valoare estimată, nu o probabilitate. Dar aceasta are o estimare punctuală, care nu captează convexitatea suplimentară a H, efectul predicției și, bineînțeles, așa cum vedem în cea de-a treia eroare de mai jos, eroarea din jurul predicției.

Patologii ale pariului. Observarea pariului cuiva nu-i dezvăluie probabilitatea, ci utilitatea sau H-ul. Spun că mă tem de alegerea candidatului. Aș face un pariu (peste măsura „statistică”, ceea ce noi numim măsura P în finanțe) că x ar câștiga – dacă ar câștiga, aș fi compensat ca un hedge. Deci, pariurile pot arăta mult mai multe preferințe și dorința de a acoperi (utilitatea încorporată în H) decât probabilitatea.

Asimetrii ale lui F(X) în viață: aproape toate situațiile de viață (cu includerea sistemelor biologice) sunt afectate cu efect neliniar: supraviețuirea, moartea, utilitatea concavă a câștigurilor, opționalitatea, pierderea locului de muncă, înfometarea, răspunsul la doză, etc.

Implicațiile filosofice ale primei erori

Aceasta arată diferența dintre „Eu știu” și „Eu fac”, și de ce „cunoașterea” și „a face” nu se indică naiv una pe alta. „Știu” este o formă de afirmație foarte subțire. Aceasta poate trece direct în acțiune în situațiile în care fie a) nu există absolut nici o probabilitate, b) F este complet liniar pentru toate valorile lui x. Cu alte cuvinte, absența totală a efectelor de ordinul doi.

Corectarea erorilor în probabilități și plăți anticipate

Acum greșeala centrală. Dacă probabilitățile au erori, atunci ambele P_{raw} și E_{raw} însele au probleme și nu ar trebui să fie utilizate fără anomalie, încorporând incertitudinea cu privire la probabilitate (indiferent de sursă, distribuție greșită, parametru greșit, etc.).

O probabilitate care are o eroare de măsurare ce depinde de un termen stocastic \lambda trebuie să fie integrată în q(\lambda), valori ponderate ale lui \lambda folosind nucleul p_{\lambda}(x) în loc de p(x).

Deci, luând Ec. (1) și corectând-o, probabilitatea brut devine, luând un nivel de eroare \lambda, convoluția (în cazul în care, pentru a evita confuzia nucleului p_{\lambda}(x) înseamnă „probabilitatea utilizării lui x folosind \lambda ca parametru în calcule”, cu q(\lambda) primul ordin „metaprobabilitate” sau distribuția de probabilitate pentru \lambda; \lambda \in \Re^N):

\displaystyle \mathstrut P_{ajustat}=\int_{D\lambda} \int_{Dx} p_\lambda (x) q(\lambda) dx d\lambda

A doua eroare: \displaystyle \mathstrut \frac{P_{ajustat}}{P_{raw}}\not=1. Aceasta se agravează la probabilități mici. Am văzut în Taleb (2012b), Taleb și Douady (2012) că, în prezența erorilor \displaystyle \mathstrut \frac{P_{ajustat}}{P_{raw}} poate depăși 10^7 pentru evenimente rare de tipul varietății „six sigma” și poate explica cozile groase. Problema Fukushima a ignorat (de către idioți incompetenți din punct de vedere binomial) efectul de convexitate necesar din metadistribuția lui q, cu raportul \displaystyle \mathstrut \frac{P_{ajustat}}{P_{raw}}>10^5.

Dar tot nu putem vorbi naiv despre P_{ajustat}.

(Notă: Acest \lambda este de dimensiuni mai mari și include cazul în care termenii de eroare pot avea termeni de eroare. Se poate folosi \lambda ca, să spunem abaterea standard, care are ea însăși o abatere standard, ceea ce face ca raportul să se înmulțească și mai mult. Presupunând că \lambda_n este eroarea de estimare a lui \lambda_{n-1} și, mai mult, asumându-ne independența erorilor, putem păstra legăturile.)

În al doilea rând, probabilitățile însele sunt supuse unor erori date de lipsa a efectului neliniar al metaprobabilităților

\displaystyle \mathstrut P_{ajustat}=\int_{D\lambda} \int_{Dx} p_\lambda (x) q(\lambda) dx d\lambda

A treia eroare. Raportul \displaystyle \mathstrut \frac{EP_{ajustat}}{EP_{raw}} este locul în care oamenii tind să se confrunte cu probleme grave – lipsește complet din economie. Aceasta este ceea ce face teoria portofoliului în special, și alte forme fragile de optimizare pentru a modela erori și pentru a predispune la scandal.

Recunoașteri

Raphael Douady, Gerd Gigerenzer

Referințe

  • De Finetti, B. (1937). La prévision : ses lois logiques, ses sources subjectives, Institut Henri Poincaré
  • Hacking, I. (1984). The emergence of probability: a philosophical study of early ideas about probability, induction and statistical inference, Cambridge Univ Pr.
  • Hacking, I. (1990). The taming of chance, Cambridge Univ Pr.
  • Hajek, A. (2003). Interpretations of probability, Stanford Encyclopedia of Philosophy
  • Taleb, N.N., and Douady, R. (2012), A Map and Simple Heuristic to Detect Fragility, Antifragility, and Model Error, under revision, Quantitative Finance
  • Taleb, N.N. (1997), Dynamic Hedging, Wiley
  • Taleb, N.N. (2001, 2005), Fooled by Randomness, Penguin (UK) and Random House (US)
  • Taleb, N.N. (2012a), Antifragility, Penguin (UK) and Random House (US), in press
  • Taleb, N.N. (2012b), The Future Has Thicker Tails than the Past: Model Error as Branching Counterfactuals, preprint
  • Van Zwet,W.R. (1964). Convex Transformations of Random Variables, Mathematical Center Amsterdam, 7

Sursa: Why We Don’t Know What We Talk About When We Talk About Probability

Cum apreciați acest articol?

Eu îl consider de 5 ⭐️ (altfel nu-l scriam). Tu?

Media evaluării / 5. Număr voturi:

Dacă ați găsit acest articol util...

Urmăriți-mă pe social media!

Regret dacă acest articol nu v-a fost util!

Permiteți-mi să-l îmbunătățesc!




Lasă un răspuns

Denumire
Email
Pagină web

Acest sit folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.