Informație clasică

Pentru a descrie informația cuantică și modul în care funcționează, vom începe cu o prezentare generală a informației clasice. Este firesc să te întrebi de ce se acordă atât de multă atenție informației clasice într-un curs despre informația cuantică, dar există motive întemeiate.

Pe de o parte, deși informația cuantică și cea clasică diferă în moduri spectaculoase, descrierile lor matematice sunt de fapt destul de similare. Informația clasică servește, de asemenea, ca punct de referință familiar când studiezi informația cuantică, precum și ca sursă de analogii care merg surprinzător de departe. Este frecvent ca oamenii să pună întrebări despre informația cuantică ce au analogi clasici naturali, iar aceste întrebări au adesea răspunsuri simple care pot oferi atât claritate, cât și perspectivă asupra întrebărilor originale despre informația cuantică. Într-adevăr, nu este deloc nerezonabil să susții că nu poți înțelege cu adevărat informația cuantică fără a înțelege informația clasică.

Unii cititori pot fi deja familiarizați cu materialul ce urmează să fie discutat în această secțiune, în timp ce alții poate nu — dar discuția se adresează ambelor audiențe. Pe lângă evidențierea aspectelor informației clasice cele mai relevante pentru o introducere în informația cuantică, această secțiune introduce notația Dirac, utilizată frecvent pentru a descrie vectori și matrice în informația și calculul cuantic. Se dovedește că notația Dirac nu este specifică informației cuantice; ea poate fi folosită la fel de bine în contextul informației clasice, precum și pentru multe alte situații în care apar vectori și matrice.

Stări clasice și vectori de probabilitate

Să presupunem că avem un sistem care stochează informații. Mai exact, vom presupune că acest sistem poate fi în una dintr-un număr finit de stări clasice la fiecare moment. Aici, termenul stare clasică trebuie înțeles în sens intuitiv, ca o configurație ce poate fi recunoscută și descrisă fără ambiguitate.

Exemplul arhitectural, la care vom reveni în mod repetat, este cel al unui bit, care este un sistem ale cărui stări clasice sunt $0$ și $1.$ Alte exemple includ un zar standard cu șase fețe, ale cărui stări clasice sunt $1,$ $2,$ $3,$ $4,$ $5,$ și $6$ (reprezentate de numărul corespunzător de puncte de pe fața de sus); o nucleobază dintr-un lanț de ADN, ale cărei stări clasice sunt A, C, G și T; și un comutator al unui ventilator electric, ale cărui stări clasice sunt (în mod obișnuit) mare, medie, mică și oprit. În termeni matematici, specificarea stărilor clasice ale unui sistem reprezintă, de fapt, punctul de pornire: definim un bit ca un sistem care are stările clasice $0$ și $1,$ și la fel pentru sistemele care au seturi diferite de stări clasice.

Pentru scopul acestei discuții, să numim $\mathsf{X}$ sistemul considerat și să folosim simbolul $\Sigma$ pentru a ne referi la mulțimea stărilor clasice ale lui $\mathsf{X}.$ Pe lângă ipoteza că $\Sigma$ este finită, deja menționată, presupunem în mod natural că $\Sigma$ este nevidă — întrucât este absurd ca un sistem fizic să nu aibă nicio stare. Și deși are sens să consideri sisteme fizice cu un număr infinit de stări clasice, vom ignora această posibilitate, care este cu certitudine interesantă, dar nu este relevantă pentru acest curs. Din aceste motive și pentru concizie, vom folosi în continuare termenul mulțime de stări clasice pentru a desemna orice mulțime finită și nevidă.

Iată câteva exemple:

Dacă $\mathsf{X}$ este un bit, atunci $\Sigma = \{0,1\}.$ Verbal, numim această mulțime alfabetul binar.
Dacă $\mathsf{X}$ este un zar cu șase fețe, atunci $\Sigma = \{1,2,3,4,5,6\}.$
Dacă $\mathsf{X}$ este comutatorul unui ventilator electric, atunci $\Sigma = \{\mathrm{high}, \mathrm{medium}, \mathrm{low}, \mathrm{off}\}.$

Atunci când te gândești la $\mathsf{X}$ ca purtător de informații, diferitele stări clasice ale lui $\mathsf{X}$ pot fi asociate cu anumite semnificații, ducând la rezultate sau consecințe diferite. În astfel de cazuri, poate fi suficient să descrii $\mathsf{X}$ ca aflându-se pur și simplu în una dintre stările sale clasice posibile. De exemplu, dacă $\mathsf{X}$ este un comutator de ventilator, s-ar putea să știm cu certitudine că este setat pe mare, ceea ce ne-ar putea determina să îl comutăm pe medie.

Adesea în procesarea informației, însă, cunoașterea noastră este incertă. O modalitate de a reprezenta cunoașterea noastră despre starea clasică a unui sistem $\mathsf{X}$ este să asociem probabilități diferitelor sale stări clasice posibile, rezultând ceea ce vom numi o stare probabilistică.

De exemplu, să presupunem că $\mathsf{X}$ este un bit. Pe baza a ceea ce știm sau așteptăm despre ce s-a întâmplat cu $\mathsf{X}$ în trecut, am putea crede că $\mathsf{X}$ se află în starea clasică $0$ cu probabilitatea $3/4$ și în starea $1$ cu probabilitatea $1/4.$ Putem reprezenta aceste credințe scriind:

\operatorname{Pr}(\mathsf{X}=0) = \frac{3}{4} \quad\text{and}\quad \operatorname{Pr}(\mathsf{X}=1) = \frac{1}{4}.

O modalitate mai succintă de a reprezenta această stare probabilistică este printr-un vector coloană.

\begin{pmatrix} \frac{3}{4}\\[2mm] \frac{1}{4} \end{pmatrix}

Probabilitatea ca bitul să fie $0$ este plasată în partea de sus a vectorului, iar probabilitatea ca bitul să fie $1$ este plasată în partea de jos, deoarece aceasta este ordinea convențională pentru mulțimea $\{0,1\}.$

În general, putem reprezenta o stare probabilistică a unui sistem cu orice mulțime de stări clasice în același mod, ca un vector de probabilități. Probabilitățile pot fi ordonate în orice mod dorim, dar există de obicei o modalitate naturală sau implicită de a face acest lucru. Precis, putem reprezenta orice stare probabilistică printr-un vector coloană care satisface două proprietăți:

Toate elementele vectorului sunt numere reale nenegative.
Suma elementelor este egală cu $1.$

Reciproc, orice vector coloană care satisface aceste două proprietăți poate fi luat ca reprezentare a unei stări probabilistice. De acum înainte, vom numi vectorii de această formă vectori de probabilitate.

Alături de concizia acestei notații, identificarea stărilor probabilistice ca vectori coloană are avantajul că operațiile asupra stărilor probabilistice sunt reprezentate prin înmulțire matrice–vector, după cum va fi discutat în curând.

Măsurarea stărilor probabilistice

Să considerăm ce se întâmplă dacă măsurăm un sistem atunci când se află într-o stare probabilistică. În acest context, prin măsurarea unui sistem înțelegem pur și simplu că ne uităm la sistem și recunoaștem fără ambiguitate starea clasică în care se află. Intuitiv, nu putem „vedea" o stare probabilistică a unui sistem; când ne uităm la el, vedem pur și simplu una dintre stările clasice posibile.

Prin măsurarea unui sistem, ne putem schimba și cunoașterea despre el, iar prin urmare starea probabilistică pe care o asociem cu el se poate schimba. Adică, dacă recunoaștem că $\mathsf{X}$ se află în starea clasică $a\in\Sigma,$ atunci noul vector de probabilitate care reprezintă cunoașterea noastră despre starea lui $\mathsf{X}$ devine vectorul care are $1$ pe intrarea corespunzătoare lui $a$ și $0$ pentru toate celelalte intrări. Acest vector indică că $\mathsf{X}$ se află în starea clasică $a$ cu certitudine — ceea ce știm tocmai fiindcă am recunoscut-o — și notăm acest vector prin $\vert a\rangle,$ care se citește „ket $a$ " dintr-un motiv care va fi explicat în curând. Vectorii de acest tip se mai numesc și vectori din baza standard.

De exemplu, presupunând că sistemul la care ne gândim este un bit, vectorii din baza standard sunt dați de

\vert 0\rangle = \begin{pmatrix}1\\[1mm] 0\end{pmatrix} \quad\text{and}\quad \vert 1\rangle = \begin{pmatrix}0\\[1mm] 1\end{pmatrix}.

Observă că orice vector coloană bidimensional poate fi exprimat ca o combinație liniară a acestor doi vectori. De exemplu,

\begin{pmatrix} \frac{3}{4}\\[2mm] \frac{1}{4} \end{pmatrix} = \frac{3}{4}\,\vert 0\rangle + \frac{1}{4}\,\vert 1\rangle.

Acest fapt se generalizează în mod natural la orice mulțime de stări clasice: orice vector coloană poate fi scris ca o combinație liniară de vectori din baza standard. Destul de des exprimăm vectorii exact în acest mod.

Revenind la schimbarea stării probabilistice în urma măsurării, putem observa o legătură cu experiențele noastre cotidiene. Să presupunem că aruncăm o monedă corectă, dar o acoperim înainte de a o privi. Am spune atunci că starea ei probabilistică este

\begin{pmatrix} \frac{1}{2}\\[2mm] \frac{1}{2} \end{pmatrix} = \frac{1}{2}\,\vert\text{heads}\rangle + \frac{1}{2}\,\vert\text{tails}\rangle.

Aici, mulțimea stărilor clasice a monedei noastre este $\{\text{heads},\text{tails}\}.$ Alegem să ordonăm aceste stări cu heads pe primul loc, tails pe al doilea.

\vert\text{heads}\rangle = \begin{pmatrix}1\\[1mm] 0\end{pmatrix} \quad\text{and}\quad \vert\text{tails}\rangle = \begin{pmatrix}0\\[1mm] 1\end{pmatrix}

Dacă am descoperi moneda și ne-am uita la ea, am vedea una dintre cele două stări clasice: heads sau tails. Presupunând că rezultatul ar fi tails, am actualiza în mod natural descrierea stării probabilistice a monedei astfel încât să devină $|\text{tails}\rangle.$ Desigur, dacă am acoperi din nou moneda, iar apoi am descoperi-o și am privi-o din nou, starea clasică ar fi în continuare tails, ceea ce este consistent cu starea probabilistică descrisă de vectorul $|\text{tails}\rangle.$

Acest lucru poate părea trivial și, într-un sens, este. Cu toate acestea, deși sistemele cuantice se comportă într-un mod complet analog, proprietățile lor de măsurare sunt frecvent considerate ciudate sau neobișnuite. Prin stabilirea proprietăților analoge ale sistemelor clasice, modul în care funcționează informația cuantică ar putea părea mai puțin neobișnuit.

O ultimă observație privind măsurările stărilor probabilistice: stările probabilistice descriu cunoașterea sau credința, nu neapărat ceva real, iar măsurarea nu face decât să ne schimbe cunoașterea, nu sistemul în sine. De exemplu, starea unei monede după ce o aruncăm, dar înainte de a o privi, este ori heads, ori tails — pur și simplu nu știm care până nu privim. La vederea că starea clasică este tails, de pildă, am actualiza în mod natural vectorul ce descrie cunoașterea noastră la $|\text{tails}\rangle,$ dar pentru altcineva care nu a văzut moneda când a fost descoperită, starea probabilistică ar rămâne neschimbată. Aceasta nu este o cauză de îngrijorare; persoane diferite pot avea cunoștințe sau credințe diferite despre un anumit sistem și, prin urmare, pot descrie acel sistem prin vectori de probabilitate diferiți.

Operații clasice

În ultima parte a acestui scurt rezumat al informației clasice, vom lua în considerare tipurile de operații ce pot fi efectuate asupra unui sistem clasic.

Operații deterministe

Mai întâi, există operații deterministe, în care fiecare stare clasică $a\in\Sigma$ este transformată în $f(a)$ printr-o funcție $f$ de forma $f:\Sigma\rightarrow\Sigma.$

De exemplu, dacă $\Sigma = \{0,1\},$ există patru funcții de această formă, $f_1,$ $f_2,$ $f_3$ și $f_4,$ care pot fi reprezentate prin tabele de valori astfel:

\begin{array}{c|c} a & f_1(a)\\ \hline 0 & 0\\ 1 & 0 \end{array} \qquad \begin{array}{c|c} a & f_2(a)\\ \hline 0 & 0\\ 1 & 1 \end{array} \qquad \begin{array}{c|c} a & f_3(a)\\ \hline 0 & 1\\ 1 & 0 \end{array} \qquad \begin{array}{c|c} a & f_4(a)\\ \hline 0 & 1\\ 1 & 1 \end{array}

Prima și ultima dintre aceste funcții sunt constante: $f_1(a) = 0$ și $f_4(a) = 1$ pentru fiecare $a\in\Sigma.$ Celelalte două nu sunt constante, ci echilibrate: fiecare dintre cele două valori de ieșire apare același număr de ori (o dată, în acest caz) pe măsură ce parcurgem toate intrările posibile. Funcția $f_2$ este funcția identitate: $f_2(a) = a$ pentru fiecare $a\in\Sigma.$ Iar $f_3$ este funcția $f_3(0) = 1$ și $f_3(1) = 0,$ mai bine cunoscută sub numele de funcția NOT.

Acțiunile operațiilor deterministe asupra stărilor probabilistice pot fi reprezentate prin înmulțirea matrice-vector. Mai precis, matricea $M$ care reprezintă o funcție dată $f:\Sigma\rightarrow\Sigma$ este cea care satisface

M \vert a \rangle = \vert f(a)\rangle

pentru fiecare $a\in\Sigma.$ O astfel de matrice există întotdeauna și este determinată în mod unic de această cerință. Matricele care reprezintă operații deterministe au întotdeauna exact un $1$ în fiecare coloană, iar toate celelalte intrări sunt $0$ .

De exemplu, matricele $M_1,\ldots,M_4$ corespunzătoare funcțiilor $f_1,\ldots,f_4$ de mai sus sunt:

M_1 = \begin{pmatrix} 1 & 1\\ 0 & 0 \end{pmatrix}, \hspace{4mm} M_2 = \begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix}, \hspace{4mm} M_3 = \begin{pmatrix} 0 & 1\\ 1 & 0 \end{pmatrix}, \hspace{4mm} M_4 = \begin{pmatrix} 0 & 0\\ 1 & 1 \end{pmatrix}.

Iată o verificare rapidă care arată că prima matrice este corectă. Celelalte trei pot fi verificate în mod similar.

\begin{aligned} M_1 \vert 0\rangle & = \begin{pmatrix} 1 & 1\\ 0 & 0 \end{pmatrix} \begin{pmatrix} 1\\ 0 \end{pmatrix} = \begin{pmatrix} 1\\ 0 \end{pmatrix} = \vert 0\rangle = \vert f_1(0)\rangle \\[4mm] M_1 \vert 1\rangle & = \begin{pmatrix} 1 & 1\\ 0 & 0 \end{pmatrix} \begin{pmatrix} 0\\ 1 \end{pmatrix} = \begin{pmatrix} 1\\ 0 \end{pmatrix} = \vert 0\rangle = \vert f_1(1)\rangle \end{aligned}

O modalitate convenabilă de a reprezenta matricele de aceste forme și altele similare folosește o notație analogă pentru vectorii linie față de cea pentru vectorii coloană discutată anterior: notăm prin $\langle a \vert$ vectorul linie care are $1$ în intrarea corespunzătoare lui $a$ și zero pentru toate celelalte intrări, pentru fiecare $a\in\Sigma.$ Acest vector se citește „bra $a.$ "

De exemplu, dacă $\Sigma = \{0,1\},$ atunci

\langle 0 \vert = \begin{pmatrix} 1 & 0 \end{pmatrix} \quad\text{and}\quad \langle 1 \vert = \begin{pmatrix} 0 & 1 \end{pmatrix}.

Pentru orice mulțime de stări clasice $\Sigma,$ putem privi vectorii linie și vectorii coloană ca matrice și putem efectua înmulțirea de matrice $\vert b\rangle \langle a\vert.$ Obținem o matrice pătratică cu $1$ în intrarea corespunzătoare perechii $(b,a)$ , adică rândul intrării corespunde stării clasice $b$ , iar coloana corespunde stării clasice $a,$ cu $0$ pentru toate celelalte intrări. De exemplu,

\vert 0 \rangle \langle 1 \vert = \begin{pmatrix} 1\\ 0 \end{pmatrix} \begin{pmatrix} 0 & 1 \end{pmatrix} = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}.

Folosind această notație, putem exprima matricea $M$ corespunzătoare oricărei funcții date $f:\Sigma\rightarrow\Sigma$ astfel:

M = \sum_{a\in\Sigma} \vert f(a) \rangle \langle a \vert.

De exemplu, considerând funcția $f_4$ de mai sus, pentru care $\Sigma = \{0,1\}.$ Obținem matricea

M_4 = \vert f_4(0) \rangle \langle 0 \vert + \vert f_4(1) \rangle \langle 1 \vert = \vert 1\rangle \langle 0\vert + \vert 1\rangle \langle 1\vert = \begin{pmatrix} 0 & 0\\ 1 & 0 \end{pmatrix} + \begin{pmatrix} 0 & 0\\ 0 & 1 \end{pmatrix} = \begin{pmatrix} 0 & 0\\ 1 & 1 \end{pmatrix}.

Motivul pentru care aceasta funcționează este următorul. Dacă ne gândim din nou la vectori ca la matrice și de data aceasta considerăm înmulțirea $\langle a \vert \vert b \rangle,$ obținem o matrice $1\times 1$ , pe care o putem interpreta ca un scalar (adică un număr). Din motive de claritate, scriem acest produs ca $\langle a \vert b\rangle$ în loc de $\langle a \vert \vert b \rangle.$ Acest produs satisface următoarea formulă simplă:

\langle a \vert b \rangle = \begin{cases} 1 & a = b\\[1mm] 0 & a \neq b. \end{cases}

Folosind această observație, împreună cu faptul că înmulțirea matricelor este asociativă și liniară, obținem

M \vert b \rangle = \Biggl( \sum_{a\in\Sigma} \vert f(a) \rangle \langle a \vert \Biggr) \vert b\rangle = \sum_{a\in\Sigma} \vert f(a) \rangle \langle a \vert b \rangle = \vert f(b)\rangle,

pentru fiecare $b\in\Sigma,$ ceea ce este exact ceea ce cerem de la matricea $M.$

Așa cum vom discuta mai în detaliu mai târziu, în cadrul unei lecții viitoare, $\langle a \vert b \rangle$ poate fi privit și ca un produs intern între vectorii $\vert a\rangle$ și $\vert b\rangle.$ Produsele interne sunt extrem de importante în informația cuantică, dar vom amâna discuția despre ele până când vor fi necesare.

În acest moment, denumirile „bra" și „ket" pot deveni evidente: alăturând un „bra" $\langle a\vert$ cu un „ket" $\vert b\rangle$ obținem un „bracket" $\langle a \vert b\rangle.$ Această notație și terminologie îi aparțin lui Paul Dirac și, din acest motiv, este cunoscută sub numele de notația Dirac.

Operații probabilistice și matrice stocastice

Pe lângă operațiile deterministe, avem și operații probabilistice.

De exemplu, consideră următoarea operație pe un bit. Dacă starea clasică a bitului este $0,$ aceasta rămâne neschimbată; iar dacă starea clasică a bitului este $1,$ aceasta este inversată, astfel încât devine $0$ cu probabilitatea $1/2$ și $1$ cu probabilitatea $1/2.$ Această operație este reprezentată de matricea

\begin{pmatrix} 1 & \frac{1}{2}\\[1mm] 0 & \frac{1}{2} \end{pmatrix}.

Poți verifica că această matrice face lucrul corect înmulțind cei doi vectori ai bazei standard cu ea.

Pentru o alegere arbitrară a unei mulțimi de stări clasice, putem descrie mulțimea tuturor operațiilor probabilistice în termeni matematici ca pe acelea reprezentate de matrice stocastice, care sunt matrice ce satisfac aceste două proprietăți:

Toate elementele sunt numere reale nenegative.
Elementele din fiecare coloană sumează la $1.$

Echivalent, matricele stocastice sunt matrice ale căror coloane formează toate vectori de probabilitate.

Putem gândi operațiile probabilistice la nivel intuitiv ca pe unele în care aleatoriul ar putea fi cumva folosit sau introdus în timpul operației, ca în exemplul de mai sus. În ceea ce privește descrierea prin matrice stocastică a unei operații probabilistice, fiecare coloană poate fi privită ca o reprezentare vectorială a stării probabilistice generate, dat fiind că intrarea de stare clasică corespunde acelei coloane.

Putem de asemenea să ne gândim la matricele stocastice ca fiind exact acele matrice care mapează întotdeauna vectori de probabilitate la vectori de probabilitate. Adică, matricele stocastice mapează întotdeauna vectori de probabilitate la vectori de probabilitate, iar orice matrice care mapează întotdeauna vectori de probabilitate la vectori de probabilitate trebuie să fie o matrice stocastică.

În sfârșit, o altă modalitate de a gândi operațiile probabilistice este că ele sunt alegeri aleatoare de operații deterministe. De exemplu, putem gândi operația din exemplul de mai sus ca aplicând fie funcția identitate, fie funcția constantă 0, fiecare cu probabilitatea $1/2.$ Aceasta este consecventă cu ecuația

\begin{pmatrix} 1 & \frac{1}{2}\\[1mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 1 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} 1 & 1\\[1mm] 0 & 0 \end{pmatrix}.

O astfel de expresie este întotdeauna posibilă, pentru o alegere arbitrară a unei mulțimi de stări clasice și orice matrice stocastică ale cărei linii și coloane sunt identificate cu acea mulțime de stări clasice.

Compuneri de operații probabilistice

Presupune că $\mathsf{X}$ este un sistem cu mulțimea de stări clasice $\Sigma,$ și că $M_1,\ldots,M_n$ sunt matrice stocastice reprezentând operații probabilistice pe sistemul $\mathsf{X}.$

Dacă prima operație $M_1$ este aplicată stării probabilistice reprezentate de un vector de probabilitate $u,$ starea probabilistică rezultată este reprezentată de vectorul $M_1 u.$ Dacă aplicăm apoi a doua operație probabilistică $M_2$ acestui nou vector de probabilitate, obținem vectorul de probabilitate

M_2 (M_1 u) = (M_2 M_1) u.

Egalitatea rezultă din faptul că înmulțirea matricelor (care include înmulțirea matrice-vector ca un caz special) este o operație asociativă. Astfel, operația probabilistică obținută prin compunerea primei și celei de-a doua operații probabilistice, unde aplicăm mai întâi $M_1$ și apoi $M_2,$ este reprezentată de matricea $M_2 M_1,$ care este în mod necesar stocastică.

Mai general, compunerea operațiilor probabilistice reprezentate de matricele $M_1,\ldots,M_n$ în această ordine, adică $M_1$ este aplicată prima, $M_2$ este aplicată a doua și așa mai departe, cu $M_n$ aplicată ultima, este reprezentată de produsul matriceal

M_n \,\cdots\, M_1.

Reține că ordinea este importantă aici: deși înmulțirea matricelor este asociativă, nu este o operație comutativă. De exemplu, dacă

M_1 = \begin{pmatrix} 1 & 1\\[1mm] 0 & 0 \end{pmatrix} \quad\text{and}\quad M_2 = \begin{pmatrix} 0 & 1\\[1mm] 1 & 0 \end{pmatrix},

atunci

M_2 M_1 = \begin{pmatrix} 0 & 0 \\[1mm] 1 & 1 \end{pmatrix} \quad\text{and}\quad M_1 M_2 = \begin{pmatrix} 1 & 1\\[1mm] 0 & 0 \end{pmatrix}.

Adică, ordinea în care sunt compuse operațiile probabilistice contează; schimbarea ordinii în care operațiile sunt aplicate într-o compunere poate modifica operația rezultantă.

Stări clasice și vectori de probabilitate​

Măsurarea stărilor probabilistice​

Operații clasice​

Operații deterministe​

Operații probabilistice și matrice stocastice​

Compuneri de operații probabilistice​