Optyka liniowa - ebook
Optyka liniowa - ebook
To pierwsza część kompleksowego opracowania na temat właściwości fali elektromagnetycznej, propagacji światła oraz oddziaływania fali świetlnej z ośrodkami. Koncentruje się na optyce liniowej, opisując zjawiska zachodzące w zakresie słabych natężeń światła, wykorzystując pojęcia z teorii sygnałów i układów liniowych.
Autor położył duży nacisk na graficzną interpretację zjawisk fizycznych, co znalazło odzwierciedlenie w dużej liczbie rysunków i wykresów wyjaśniających omawiane zagadnienia.
Książka może być traktowana jako podręcznik do przedmiotów związanych z optyką na kierunkach fizycznych, matematycznych oraz technicznych. Może stanowić także źródło wiedzy dla osób zawodowo zajmujących się tą dziedziną.
Kategoria: | Fizyka |
Zabezpieczenie: |
Watermark
|
ISBN: | 978-83-01-21241-4 |
Rozmiar pliku: | 22 MB |
FRAGMENT KSIĄŻKI
Prezentowana książka pisana była z myślą, aby w sposób możliwie przystępny przedstawić matematyczny opis właściwości fali świetlnej oraz jej rozchodzenia się w ośrodkach liniowych, opierając się na klasycznej teorii elektromagnetyzmu i przedstawiając zarazem kilka wybranych przykładów z optyki współczesnej. Dokładniejsze określenie, czym jest ośrodek liniowy, zostanie podane w dalszej części. W tym miejscu wystarczy zaznaczyć, że niemal wszystkie zjawiska optyczne, z którymi spotykamy się na co dzień, należą do obszaru optyki liniowej. W takim wypadku parametry optyczne ośrodka, takie jak współczynnik załamania czy współczynnik absorpcji, nie ulegają zmianie w wyniku oddziaływania nań fali świetlnej. Generalnie optyka liniowa wiąże się z małymi natężeniami światła, szereg optycznych zjawisk nieliniowych obserwuje się dopiero przy dużych gęstościach mocy światła, rzędu kW/cm². Stąd, chociaż historycznie pierwsze obserwacje zjawisk nieliniowych datuje się na lata 50. XX wieku, gwałtowny rozwój tej dziedziny optyki nastąpił dopiero po wynalezieniu lasera w 1960 roku. Tym niemniej należy zaznaczyć, że w optyce współczesnej badane są także zjawiska nieliniowe, które nie wymagają wysokich natężeń światła.
Podstawową cechą definiującą układy liniowe jest stosowalność zasady superpozycji, w ramach której badany sygnał może być przedstawiony jako kombinacja liniowa sygnałów elementarnych. Pozwala to na stosowanie do opisu sygnałów optycznych, zarówno czasowych, jak i przestrzennych, niektórych podstawowych pojęć (jak odpowiedź impulsowa, czy funkcja przenoszenia) oraz metod matematycznych zaczerpniętych z ogólnej teorii sygnałów i układów liniowych. W tym kontekście zarówno przestrzeń swobodna, jak i ośrodek liniowy może być traktowany jako rodzaj przetwornika, który zmienia strukturę czasową lub przestrzenną sygnału optycznego. Z tego powodu w książce omówiono dość szczegółowo dwie podstawowe operacje służące do analizy układów liniowych, jakimi są splot sygnałów i przekształcenie Fouriera.
Opis matematyczny stosowany w książce jest oparty na falowej teorii elektromagnetyzmu wynikającej z równań Maxwella (rozdział 1), natomiast w przypadku omawiania odpowiedzi ośrodka na falę EM (rozdział 4) korzysta się z prostego klasycznego oscylatorowego modelu materii. Tym niemniej w paru miejscach odwołano się do kwantowego obrazu światła jako strumienia fotonów.
Zwykle we wstępie do książki autor zaznacza, dla jakiego grona odbiorców jest ona adresowana. W zamyśle opracowanie przeznaczone jest dla wszystkich osób zainteresowanych właściwościami światła wynikającymi z teorii elektromagnetycznej, choć siłą rzeczy z uwagi na podręcznikowy charakter książka powinna okazać się użyteczna dla studentów fizyki, optoelektroniki czy optyki, a także młodych stażem pracowników nauki jako wprowadzenie w podstawowe zagadnienia optyki klasycznej. Lektura książki wymaga pewnej, choć w rzeczywistości niezbyt zaawansowanej wiedzy matematycznej obejmującej zakres wiadomości wykładanych na pierwszym roku studiów na uczelniach technicznych. Dotyczy ona głównie znajomości równań różniczkowych oraz elementów teorii pola. W tym ostatnim przypadku, dla przypomnienia ważniejszych pojęć z tego zakresu, na końcu książki zamieszczono dodatek matematyczny, w którym przedstawiono skrótowo podstawowe operacje z rachunku analizy pola wektorowego. Znajomość przekształcenia Fouriera, które jest wielokrotnie w książce wykorzystywane, nie jest konieczna, potrzebne wiadomości z zakresu transformaty Fouriera zostały przedstawione w opracowaniu. Przeglądając książkę Czytelnik napotka dużą liczbę wzorów, co wynika między innymi z faktu, iż podano wyprowadzenie praktycznie wszystkich zamieszczonych zależności, starając się zarazem, aby każdy z rozdziałów stanowił w miarę kompletną całość.
W niniejszej książce podjęto także próbę pokazania, że wiele z omawianych zagadnień można zilustrować, wykonując stosunkowo proste obliczenia numeryczne przy wykorzystaniu dostępnych, popularnych pakietów programowych. W tym celu zamieszczono kilkanaście krótkich skryptów napisanych w programie Matlab. Zrezygnowano ze szczegółowego wyjaśnienia znaczenia poleceń matlabowskich. Wydaje się, że dla przeciętnego użytkownika Matlaba (do tego też grona zalicza się autor) interpretacja większości, jeśli nie wszystkich podanych skryptów nie powinna sprawić większych trudności. Ponadto większość z podanych m-plików korzysta ze stosunkowo niedużej liczby podstawowych poleceń, których objaśnienie można łatwo uzyskać, sięgając do wbudowanego w programie systemu pomocy. Zasadniczo w skryptach wykorzystano niemal bez wyjątku obliczenia numeryczne z pominięciem obliczeń symbolicznych wymagających zainstalowania pakietu do tego rodzaju obliczeń. W związku z tym skrypty mogą być uruchomiane również w dużo starszych, podstawowych wersjach programu.
Współczesna optyka jest bardzo obszernym przedmiotem, szczególnie jeśli dodatkowo wkroczyć na obszar jej zastosowań, w tym zagadnień dotyczących na przykład budowy i działania elementów fotonicznych, bardziej złożonych układów i instrumentów optycznych, czy urządzeń optoelektronicznych. Czytelnikowi, który byłby zainteresowany przykładową listą zagadnień, którymi zajmuje się współczesna optyka, można polecić zapoznanie się poprzez Internet ze spisem treści obszernej, pięciotomowej encyklopedii Handbook of Optics.
Z tej przyczyny niniejsza książka prezentuje przegląd jedynie wybranych zagadnień, gdzie motywem przewodnim jest analiza propagacji światła w jednorodnych ośrodkach liniowych, chociaż w kilku miejscach poruszono zagadnienia należące do optyki nieliniowej. Przedstawiono zarówno tematy obecne w większości podręczników optyki, takie jak klasyczny model dyspersji (rozdziały 3 i 4), skalarna teoria dyfrakcji (rozdziały 7 i 10), teoria wiązki gaussowskiej (rozdziały 11 i 12), czy rozchodzenie się fali świetlnej w ośrodkach izotropowych i anizotropowych (rozdziały 2 i 14), ale włączono także kilka tematów rzadko spotykanych literaturze polskojęzycznej, a które stanowią przykłady nowszych osiągnięć w obszarze współczesnej optyki. Można tu wymienić zjawisko tzw. „wolnego” i „szybkiego” światła (choć doświadczenia te mieszczą się w obszarze optyki nieliniowej), wiązek z wirem optycznym (rozdział 6), czy wiązek bezdyfrakcyjnych (rozdział 13). Szerzej niż zwykle się to czyni potraktowano zagadnienie prędkości światła, uznając je za jedno z podstawowych.
Należy podkreślić, że treść rozdziałów powinna być traktować tylko jako wprowadzenie w daną tematykę. Żyjemy w czasach, gdy w zasadzie każdy, nawet wysoce specjalistyczny temat wsparty jest obszerną literaturą przedmiotu, zarówno w postaci pozycji monograficznych, jak i licznych artykułów. Na końcu każdego rozdziału podano spis literatury, przy czym ograniczono się do podania 10-15 pozycji, głównie książkowych, które zdaniem autora można uznać za reprezentatywne i które stanowiły literaturę bazową przy opracowaniu rozdziałów.
Przeglądając zakres zamieszczonych tematów nietrudno zauważyć pominięcie w książce kilku ważnych i standardowych zagadnień optyki liniowej, jak na przykład: przybliżenia optyki geometrycznej, analizy odbicia i załamania światła za pomocą wzorów Fresnela, dyskusji optyki fourierowskiej i filtracji przestrzennej, czy braku opisu prostych układów optycznych i urządzeń wykorzystujących przedstawiane zjawiska fizyczne. Zasadniczym powodem takiego zawężenia tematycznego jest fakt, iż niniejsza książka stanowi w założeniu pierwszą część większego opracowania. W drugim tomie poświęconym rozmaitym ośrodkom niejednorodnym zamieszczone zostaną tematy, które nie znalazły się w niniejszej książce.
Autor chciałby wyrazić podziękowanie Recenzentowi prof. Wojciechowi Gawlikowi za trud przeczytania opracowania i cenne uwagi, które przyczyniły się do nadania postaci ostatecznej wersji książki. Mojemu koledze z Zakładu Telekomunikacji i Fotoniki ZUT Patrykowi Urbanowi dziękuję za przekazanie merytorycznych komentarzy dotyczących rozdziału poświęconego propagacji światła w światłowodach. Na koniec, słowa podziękowania należą się również Wydawcy PWN Panu Karolowi Zawadzkiemu za życzliwość, zaangażowanie w projekt wydawniczy i bardzo dobrą współpracę.
Z pewnością mimo starań nie wszystkie błędy i nieścisłości w książce udało się usunąć. Autor będzie wdzięczny Czytelnikowi za ich wskazanie. Wszelkie uwagi można kierować na adres [email protected].
Szczecin, styczeń 2020 AutorWPROWADZENIE
A. Widmo fal elektromagnetycznych
Rys. 1. Widmo fal elektromagnetycznych z wyodrębnieniem części widzialnej widma. Przedrostki jednostek: T (tera) = 10¹², P (peta) = 10¹⁵, E (eksa) = 10¹⁸
-------------------------- --------------
Zakres długości fal Kolor
380–420 fioletowy
420–450 indygo
450–490 niebieski
490–570 zielony
570–590 żółty
590–620 pomarańczowy
620–760 czerwony
-------------------------- --------------
W ujęciu klasycznym światło jest falą elektromagnetyczną (EM). Prostych i zarazem przekonujących dowodów dostarczają doświadczenia z interferencją, dyfrakcją (faktycznie również stanowiącą efekt interferencyjny) oraz z polaryzacją światła. Zakres widmowy znanych fal EM jest niezwykle szeroki, przekracza 17 rzędów wielkości, od kilometrowych fal radiowych po promieniowanie gamma o długości rzędu rozmiarów jądra atomowego (rys. 1, tab. 1). Podział widma na poszczególne zakresy wynika ze sposobu generowania i detekcji fal EM oraz po części z ich charakterystycznych właściwości, przy czym granice między zakresami nie są ściśle określone i pasma częściowo się nakładają – wartości podane w tabeli 1 są najczęściej podawane w literaturze, ale mają charakter orientacyjny. W miarę wzrostu częstotliwości fal coraz wyraźniej uwidacznia się korpuskularna (fotonowa) natura promieniowania EM w oddziaływaniach z materią. W optyce przedmiotem zainteresowania jest przede wszystkim światło z zakresu widzialnego, tj. 380-760 nm, w urządzeniach fotonicznych interesujący zakres spektralny rozszerza się w obszar bliskiego nadfioletu i bliskiej podczerwieni, obejmując przedział w przybliżeniu (0,1-10) mm, co w znacznej mierze uwarunkowane jest właściwościami materiałów dielektrycznych i półprzewodnikowych stosowanych w urządzeniach fotonicznych.
Tabela 1. Podział fal elektromagnetycznych na zakresy
Nazwa zakresu
Długość fali
(λ)
Częstotliwość
(f)
Energia fotonu (hf)
Przykład źródła
Fale radiowe1)
km – 30 cm
kHz – 1 GHz
< 4⋅10–6 eV
oscylacje prądu w układach elektrycznych i elektronicznych
Mikrofale
30 cm – 1 mm
(1–300) GHz
(0,004–4) meV
obwody elektryczne (magnetron, radar, telefonia komórkowa), przejścia elektronowe między poziomami rotacyjnymi w cząsteczkach
Podczerwień2)
(IR – infrared)
1 mm – 760 nm
300 GHz – 400 THz
4 meV – 1,6 eV
gorące ciała (wzbudzenia oscylacyjne cząsteczek i elektronowe w atomach)
Widzialne3)
(VIS – visible)
(760–380) nm
(400–800) THz
(1,6–3,3) eV
źródła żarowe (oscylacje wzbudzonych elektronów w zewnętrznych powłokach atomów)
Ultrafiolet
(UV – ultraviolet)
(380–10) nm
(0,8–30) PHz
(3,3–20) eV
Słońce (wzbudzenie elektronów w zewnętrznych i wewnętrznych powłokach atomów)
Promieniowanie X (rentgenowskie)
10 nm – 10 pm
30 PHz – 30 EHz
120 eV – 120 keV
lampy rentgenowskie (hamowanie w materii rozpędzonych elektronów, przejścia elektronów w wewnętrznych powłokach atomów)
Promieniowanie γ (gamma)4)
< 30 pm
> 10 EHz
> 40 keV
wzbudzone i promieniotwórcze jądra atomowe, rozpady cząstek elementarnych
1) W przypadku fal radiowych teoretycznie nie ma ograniczenia na maksymalną długość fali, chociaż przy niskich częstościach, np. dla częstotliwości 50 Hz mamy λ = 6⋅10³ km, obie składowe pola EM można mierzyć (rozpatrywać) oddzielnie, stąd nie traktujemy takiego pola jako promieniowania, dla którego obie składowe są powiązane. Ograniczenie dla fal krótkich wynika ze stosowanych pasm fal radiowych i TV.
2) Zakres podczerwieni dzieli się czasem na 4 zakresy: bliska IR (0,76–3) mm, średnia IR (3-6) mm, daleka IR (6–15) mm, bardzo daleka IR (15–1000) mm.
3) Największa czułość ludzkiego oka przypada na środek widma VIS – falę o długości ok. 550 nm.
4) Fotony promieniowania gamma o rekordowej, ultrawysokiej energii Ef ~ 450 TeV = 4,5⋅10¹⁴ eV zarejestrowano w 2019 r., obserwując Mgławicę Kraba z centralnym pulsarem; dla takich fotonów częstotliwość f ~ 10²⁹ Hz, długość fali λ ~ 10–21 m (!).
W tabeli 2 zestawiono wzory na częstotliwości (f), częstości (ω) oraz energie fotonów (Wf), a w tabeli 3 wartości tych wielkości dla wybranych długości (λ) dla fal z zakresu optycznego.
Tabela 2. Wzory na częstość fali EM i energię fotonów
Wielkość
Wzór
Jednostka
Częstotliwość fali
f = c/λ
Hz = 1/s
Częstość fali
ω = 2πf = 2πc/λ
rad/s
Energia fotonu
Wf = hf = ħω
J lub eV
Energia fotonu (wygodny wzór do obliczania energii fotonów w elektronowoltach)
1 eV ≈ 1,602⋅10–19 J
c = 299792458 m/s ≈ 3⋅10⁸ m/s – prędkość światła w próżni,
h ≈ 6,626⋅10–34 J⋅s – stała Plancka
ħ = h/(2π) ≈ 1,055⋅10–34 J⋅s – stała Plancka (h kreślone),
a jeśli wyrażać energię w eV, to h ≈ 4,14⋅10–15 eV⋅s, ħ ≈ 6,6⋅10–16 eV⋅s,
q ≈ 1,602⋅10–19 C – ładunek elementarny
Tabela 3. Częstotliwości, częstości i energie fotonów dla fal z zakresu widzialnego
-------- --------------- ------------------ ---------
λ f × 10¹⁴ ω × 10¹⁵ Wf
0,38 7,89 4,96 3,26
0,42 7,14 4,49 2,95
0,46 6,52 4,10 2,70
0,50 6,00 3,77 2,48
0,54 5,56 3,49 2,30
0,58 5,17 3,25 2,14
0,62 4,84 3,04 2,00
0,66 4,55 2,86 1,88
0,70 4,29 2,69 1,77
0,74 4,05 2,55 1,68
0,78 3,85 2,42 1,56
-------- --------------- ------------------ ---------
B. Poziomy opisu zjawisk optycznych
Podstawowym celem wykładów zawartych w książce jest przedstawienie podstaw fizycznych dotyczących właściwości fali świetlnej jako fali EM, propagacji wiązki świetlnej w jednorodnym ośrodku liniowym oraz opis oddziaływania fali z tego typu ośrodkiem w ramach modelu klasycznego. Opis klasyczny oznacza pominięcie efektów kwantowych, zarówno jeśli chodzi o model światła, jak i cech materii. Jest rzeczą godną odnotowania, że na gruncie powyższego przybliżenia udaje się wyjaśnić bardzo szeroki wachlarz zagadnień fizycznych, uzyskując bardzo dobrą zgodność z doświadczeniem.
Patrząc od strony historycznej, opis zjawisk optycznych odbywał się na coraz wyższych poziomach złożoności. Najprostszym ujęciem jest posługiwanie się pojęciem promienia świetlnego na gruncie optyki geometrycznej. Teoria ta (z ang. ray optics) ma wciąż duże znaczenie praktyczne, m.in. w optyce stosowanej przy projektowaniu układów soczewkowych. Kolejnym poziomem opisu jest prosta optyka falowa, gdzie uwzględnia się falowy charakter światła, ale nie wnika w naturę fali świetlnej. Takie założenie pozwala wytłumaczyć (przynajmniej w pierwszym przybliżeniu) takie charakterystyczne zjawiska falowe jak interferencja i dyfrakcja światła, jak również pozwala opisać rozchodzenie się prostych typów fal świetlnych jak fala płaska, cylindryczna czy sferyczna w jednorodnym, izotropowym ośrodku. Dzięki równaniom Maxwella dostępny staje się trzeci poziom opisu, który pozwala m.in. wziąć pod uwagę efekty polaryzacji fali świetlnej i analizować propagację wiązek optycznych o bardziej skomplikowanej strukturze (jak opisane w dalszych rozdziałach wiązki gaussowskie, wirowe, czy bezdyfrakcyjne), rozchodzenie się fali EM w kryształach anizotropowych, jak również wyjaśnić w sposób klasyczny oddziaływanie światła z materią. W konsekwencji możliwe staje się określenie pochodzenia współczynnika załamania, rozkładu widma absorpcji i refrakcji czy badanie zjawiska dyspersji prowadzące do poszerzenia i zmiany kształtu impulsów optycznych. Kolejne uściślenie polega na podejściu półklasycznym, w ramach którego uwzględnia się pewne kwantowe właściwości atomów, podczas gdy światło traktuje się klasycznie jak falę EM. Przykładowo, model taki leży u podstaw półklasycznej teorii lasera. Ujęciem najdokładniejszym jest kwantowy opis światła zarówno jako strumienia fotonów, jak i atomów. W książce posługujemy się zasadniczo opisem z poziomu trzeciego, wspominając jedynie w kilku miejscach model fotonowy. Przedstawiony podział na poziomy dokładności opisu zjawisk optycznych ilustruje schematycznie rysunek 2 poniżej.
Rys. 2. Teoria kwantowa (5) dostarcza wyjaśnienia praktycznie wszystkich zjawisk optycznych. Wiele doświadczeń można wytłumaczyć na gruncie modelu półklasycznego (4), w którym zarówno pole EM, jak i elektrony traktowane są falowo. Elektromagnetyczna teoria światła (3) daje kompletny opis klasyczny zjawisk optycznych. Optyka falowa (2) stanowi przybliżenie skalarne teorii (3). Opis w ramach optyki geometrycznej (1) można rozważać jako przypadek graniczny (λ → 0) modelu falowego
C. Określenia nazw ośrodków optycznych
Przedstawione w książce rozważania odnoszą się zasadniczo do ośrodków liniowych, w większości przypadków rozpatrywane są dielektryki izotropowe. Jest to związane z faktem, że w optyce, mówiąc o rozchodzeniu się światła, interesujące są głównie materiały przezroczyste i dla fali EM będą to przede wszystkim dielektryki. Tym niemniej obok dielektryków ważnym materiałem są metale m.in. z uwagi na zdolność odbijania światła w szerokim zakresie (zwierciadła). Stąd dość szczegółowe omówienie w jednym z rozdziałów właściwości optycznych metali w ramach klasycznego modelu elektronów swobodnych.
Rozróżnienia materiałów, jeśli chodzi o ich właściwości optyczne dokonuje się najczęściej na podstawie relacji pomiędzy zmiennym w przestrzeni i czasie wektorem natężenia pola elektrycznego E = E(r, t) fali świetlnej i wektorem polaryzacji P = P(r, t) charakteryzującym odpowiedź materiału na pobudzenie falą EM. Wektor E można traktować jako sygnał wejściowy, a wektor P jako sygnał wyjściowy układu w postaci ośrodka materialnego. Określenie związku pomiędzy E i P jest podstawą do zdefiniowania różnego typu ośrodków. Poniżej podano jak należy rozumieć stosowane w dalszej części określenia dla ośrodków optycznych. Bardziej szczegółowa dyskusja zostanie zamieszczona w rozdziałach książki.
(1) Ośrodek nazywamy liniowym, jeśli dla fali świetlnej monochromatycznej (fali o określonej częstości) między wektorami E(ωt) i P(ωt) zachodzi zależność liniowa P(ωt) = ε₀χ(1)E(ωt). Inaczej mówiąc, na pobudzenie harmoniczne ośrodek odpowiada sygnałem o tej samej częstości. Gdy współczynnik χ(1), zwany polaryzowalnością liniową lub polaryzowalnością pierwszego rzędu, jest wielkością skalarną, wówczas ośrodek jest izotropowy. Wtedy składowe wektora P: Pj (j = x, y, z) są równe Pj = ε₀χ(1)Ej, inaczej mówiąc wektory P i E są równoległe. W takim przypadku właściwości ośrodka nie zależą od kierunku przykładanego pola, dla fali świetlnej oznacza to, że nie ma znaczenia kierunek polaryzacji fali. W przypadku bardziej ogólnym wielkość χ(1) przedstawia tablicę 3×3 = 9 współczynników zwaną tensorem drugiego rzędu; w takiej sytuacji relacja liniowa dla fali harmonicznej wyraża się wzorem Pj/ε₀ = χjxEx + χjyEy + χjzEz i wektory E i P mają różne kierunki. Taki ośrodek nazywamy liniowym, anizotropowym. Znaczenie ma tutaj polaryzacja fali świetlnej.
(2) Ośrodek jest jednorodny, jeżeli relacja między P(r) i E(r) nie zależy od wektora położenia r, innymi słowy w każdym punkcie ośrodek wykazuje takie same właściwości.
(3) Ośrodek jest niedyspersyjny (czasowo), jeżeli na zmianę pola elektrycznego E(t) polaryzacja P(t) reaguje natychmiastowo; dla ośrodka liniowego, izotropowego obowiązywałoby wtedy równanie P(t) = ε₀χ⋅E(t). Cechę taką można również nazwać lokalnością czasową. Jest to zawsze idealizacja, w praktyce ośrodki takie nie istnieją, czas odpowiedzi może być bardzo krótki, ale zawsze skończony. Dla rzeczywistych ośrodków dyspersyjnych ich reakcja zależy od częstości harmonicznego elektrycznego pola pobudzającego E(ωt) fali EM. Zależność podatności elektrycznej od częstości pola E, czyli χ = χ(ω) określa zależność dyspersyjną ośrodka.
D. Optyka liniowa i nieliniowa
Jak już wspomniano we Wstępie, w zasadzie wszystkie dobrze znane z codziennego doświadczenia zjawiska optyczne zachodzące w zakresie względnie słabych natężeń światła jak odbicie, rozproszenie, załamanie czy tłumienie światła należą do obszaru optyki liniowej. W każdym z wymienionych wyżej zjawisk światło, oddziałując z ośrodkiem, zachowuje tę samą częstość (dotyczy to fali odbitej, załamanej, rozproszonej, przechodzącej) oraz nie wpływa na zmianę wartości parametrów optycznych ośrodka, takich jak współczynnik załamania czy współczynnik absorpcji. W szczególności w ośrodku liniowym wiązki świetlne rozchodzą się niezależnie od siebie, tj. bez wzajemnego oddziaływania. Aby wyraźniej unaocznić ramy stosowalności optyki liniowej, warto choćby pobieżnie spojrzeć na kontrprzykład, jakim jest optyka nieliniowa, tym bardziej że w książce wspomniano w kilku miejscach o zjawiskach zaliczanych do domeny optyki nieliniowej, takich jak elektromagnetycznie indukowana przeźroczystość czy zjawiska nieliniowe występujące w światłowodach telekomunikacyjnych.
W przypadku ośrodków nieliniowych relacja między P(ω) i E(ω) może być rozpisana (choć nie zawsze) w postaci szeregu (przy czym wyrazy rozwinięcia rzędu wyższego niż trzeci są zazwyczaj pomijane)
P(ω) = ε₀χ(1)E(ω) + ε₀χ(2)E(ω₁)E(ω₂) + ε₀χ(3)E(ω₁)E(ω₂)E(ω₃) + ...
(i)
gdzie bezwymiarowe wielkości χ(j) oznaczają:
χ(1) – podatność pierwszego rzędu (zjawiska liniowe),
χ(2) – podatność drugiego rzędu (zjawiska nieliniowe drugiego rzędu, które nie występują w ośrodkach izotropowych jak gazy, ciecze, szkła, gdzie χ(2) = 0)
χ(3) – podatność trzeciego rzędu (zjawiska nieliniowe trzeciego rzędu).
W ogólnym przypadku podatności elektryczne χ(1), χ(2), χ(3) są tensorami, odpowiednio drugiego, trzeciego i czwartego rzędu, tj. obiektami matematycznymi składającymi się z szeregu elementów oznaczanych kolejno dwoma, trzema lub czterema indeksami, dzięki czemu może być określona zależność odpowiedniej składowej P od składowych wektorów E₁, E₂, E₃. Pola elektryczne E występujące w zależności (i) mogą mieć różne częstości – na przykład do ośrodka wchodzą dwie lub trzy różne wiązki optyczne lub do ośrodka przykładane jest zewnętrzne wolnozmienne pole elektryczne o częstości ω ≈ 0. W konsekwencji, obok częstości pól wejściowych, w odpowiedzi (polaryzacji elektrycznej) ośrodka pojawią się człony zawierające częstości sumacyjne bądź różnicowe, co określa się mianem mieszania częstości. Przykładowo, dla nieliniowości χ(2) przy założeniu ω₁ = ω₂ = ω możliwy jest proces typu ω +ω → 2ω, zwany generacją drugiej harmonicznej (ang. second-harmonic generation, SHG), natomiast w przypadku rozchodzenia się fali świetlnej (ω₁ = ω) w obecności stałego pola elektrycznego E₀ (ω₂ = 0) w procesie ω + 0 → ω może wystąpić zmiana wartości współczynnika załamania n proporcjonalna do natężenia pola elektrycznego: Δν ∝ E₀ – zjawisko nosi nazwę efektu elektrooptycznego Pockelsa.
Przykładami zjawisk dla nieliniowości z χ(3), przy najprostszym założeniu, iż ω₁ = ω₂ = ω₃ = ω, jest generacja trzeciej harmonicznej (ang. third-harmonic generation, THG) w procesie ω + ω +ω → 3ω lub generacja fali o niezmienionej częstości w procesie ω – ω + ω → ω, ale ze zmianą współczynnika załamania n proporcjonalną do kwadratu natężenia wiązki świetlnej – jest to tzw. nieliniowy efekt Kerra: Δn = n – n₀ ≈ n₂|E|² = n₂I, gdzie I = C|E|² oznacza natężenie światła, n₀ – liniowy współczynnik załamania oraz n₂ ∝ χ(3). Jeżeli pole E jest polem stałym (ω = 0), to mówi się o efekcie elektrooptycznym Kerra.
Istnieją różnorakie mechanizmy nieliniowości optycznej, o różnej „sile” i szybkości odpowiedzi określonej pewnym charakterystycznym czasem τ. Można tu wymienić m.in.:
• polaryzację elektronową (wszystkie materiały; bardzo słaba nieliniowość, bardzo krótki czas τ),
• nieliniowość absorpcyjną (m.in. półprzewodniki),
• nieliniowość związaną z efektami termicznymi,
• nieliniowość orientacyjną (ciekłe kryształy),
• zjawisko fotorefrakcyjne (dielektryki i półprzewodniki; bardzo silna nieliniowość, o względnie długim czasie odpowiedzi).
W szczególności podane wyżej przykłady zjawisk nieliniowych drugiego i trzeciego rzędu wynikają z mechanizmu polaryzacji elektronowej, który polega na oddziaływaniu pola elektrycznego fali świetlnej na powłoki elektronowe atomów. Powstałe w ten sposób oscylujące indukowane dipole atomowe stają się źródłem wtórnych fal elektromagnetycznych. W rozdziałach 3 i 4 omawiany jest dokładniej taki model atomu traktowanego klasycznie jako oscylator harmoniczny. Założenie liniowości drgań atomu, poprawne przy małych wartościach pola E fali świetlnej wymaga korekty przez uwzględnienie członów nieliniowych w przypadku, gdy stosowane są wiązki o dużych natężeniach, wtedy bowiem oscylacje elektronów w atomach przestają być harmoniczne. Człony nieliniowe traktowane w szeregu (i) jako małe poprawki w stosunku do wyrazu liniowego względnie łatwo wyznacza się w ramach klasycznego modelu oscylatorowego. Jeśli założyć, że częstość fali (ω) jest znacznie mniejsza od częstości rezonansowej oscylatora (ω₀), tzn. zachodzi oddziaływanie poza rezonansem (ośrodek jest przezroczysty), to otrzymuje się podatności elektryczne wyrażone wzorami:
, , ,
(ii)
skąd wynika przybliżona relacja
,
(iii)
gdzie: N – koncentracja atomów, q – ładunek elektronu, me – masa efektywna elektronu, d – średnia odległość między atomami ośrodka.
Oszacowanie rzędu wielkości χ(j) przy założeniu typowych wartości parametrów dla ciał stałych, dla których można z grubsza przyjąć: ω₀ ~ 10¹⁶ rad/s, N ~ 10²⁸ m–3, d = (1/N)1/3 ~ 3⋅10–10 m = 0,3 nm, daje χ(1) ~ 10 oraz p ~ 10–12 m/V, skąd χ(2) ~ 10–11 m/V, χ(3) ~ 10–23 m²/V². Są to wartości zgodne z danymi doświadczalnymi. Ponieważ podatności rzędu drugiego i trzeciego są bardzo małe, optyczne efekty nieliniowe rozważane w ramach mechanizmu polaryzacji elektronów w atomach ujawniają się dopiero przy wysokich natężeniach światła. Tłumaczy to, dlaczego rozwój tej dziedziny nastąpił po wynalezieniu lasera (1960 r.); za pomocą wiązki światła laserowego można uzyskać gęstości mocy umożliwiające łatwą obserwację tego rodzaju zjawisk.
Należy zaznaczyć, że nie zawsze nieliniowość daje się opisać za pomocą szeregu (i), który może być rozbieżny; wówczas wymagany jest odmienny sposób przedstawienia nieliniowości. Z sytuacją tego typu mamy na przykład do czynienia w przypadku rezonansowego wzbudzenia układów atomowych prowadzącego do absorpcji nasyceniowej, a także w zjawisku oddziaływania nierezonansowego, gdy pole elektryczne wiązki świetlnej jest porównywalne z polem wewnątrzatomowym. Należy też wskazać, iż duże natężenia światła kojarzone z optyką nieliniową nie zawsze są warunkiem koniecznym. W XXI wieku prowadzi się badania nad optycznymi zjawiskami nieliniowymi, które można obserwować przy małych, a czasem bardzo małych natężeniach wiązek optycznych. Jednym z przykładów, jest wspominane w rozdziale 6 w kontekście omawiania „wolnego” światła, zjawisko elektromagnetycznie wymuszonej przezroczystości, w którym rezonansowa absorpcja prowadzi do wytworzenia okna przezroczystości w ośrodku.
Optyczne zjawiska nieliniowe jako niemieszczące się w kategorii znanych zjawisk optyki liniowej są często zaskakujące w swym przebiegu. W ramach takich efektów ośrodek daje możliwość na przykład: generacji nowych częstości fal, zmieniania kształtu wiązki (samoogniskowanie i autokolimacja), wytwarzania ultrakrótkich impulsów optycznych, otrzymywania impulsów zwanych solitonami (czasowymi) zachowujących kształt w trakcie propagacji (o których wspomniano w drugiej części rozdziału 5), jak również solitonów przestrzennych – wiązek o niezmiennym rozkładzie poprzecznym, które na wzór cząstek mogą się przyciągać lub odpychać, generować fale będące odwróceniem w czasie fali padającej (efekt odwracania frontu falowego), wzmacniania wiązki słabej kosztem silniejszej (generacja parametryczna) itd.
Powyższe krótkie spojrzenie na optykę nieliniową miało na celu uświadomienie Czytelnikowi, że zjawiska z obszaru optyki liniowej stanowią jedynie wycinek szerokiego spektrum zjawisk optycznych. Niemniej jednak to fizyka optyki liniowej buduje fundament niezbędny do zrozumienia bardziej złożonych zjawisk z tej dziedziny, tym bardziej że współczesna optyka przynosi nowe odkrycia także na tym polu, czego przykładem mogą być wiązki światła o skręconym froncie falowym, wiązki bezdyfrakcyjne, czy fascynujące, lecz nie omawiane w książce jako wykraczające poza jej zakres, doświadczenia z dziedziny optyki kwantowej.2
ROZCHODZENIE SIĘ FALI MONOCHROMATYCZNEJ W OŚRODKU
Rozważmy jednorodny, izotropowy ośrodek bez ładunków swobodnych i prądów przewodzenia scharakteryzowany stałą dielektryczną εr i stałą magnetyczną μr. Jak pokazano w rozdziale 1, w takim przypadku z równań Maxwella wyprowadza się dla wektorów E(r, t) lub H(r, t) równania falowe postaci (1.44), (1.50), a dla pól harmonicznych E = E(r,ωt), H = H(r,ωt) równania w formie (1.64). Dla przypomnienia powtórzymy tutaj oba równania, skupiając uwagę na wektorze E (dla wektora H równania są takie same):
, .
(2.1a,b)
Każde z powyższych równań wektorowych jest równoważne trzem równaniom skalarnym dla każdej składowej x, y, z identycznych dla ośrodka jednorodnego. Przypomnijmy, że dla nieharmonicznej funkcji E = E(r, t) równanie (2.1) w dziedzinie czasu obowiązuje dla ośrodka niedyspersyjnego, podczas gdy w równaniu (2.1b) stałe εr(ω), μr(ω) są funkcjami częstości. Równanie (2.1a) nosi ogólną nazwę równania falowego, natomiast (2.1b) - równania falowego Helmholtza. Określenie „falowe” uzasadnione jest faktem, iż rozwiązaniem równań (2.1) jest wyrażenie opisujące falę EM. Najprostszym i niezwykle ważnym przykładem takiej fali jest monochromatyczna fala płaska.
2.1. Fala płaska monochromatyczna
Zmienne pole elektryczne harmonicznej fali płaskiej, periodycznej w czasie i przestrzeni, w notacji wykładniczej reprezentuje wyrażenie
E(r,ωt) = E₀exp,
(2.2a)
które odpowiada funkcji rzeczywistej Re = epE₀cos(ωt - k⋅r + φ), gdzie ep oznacza wersor określający kierunek wektora E₀. W zapisie (2.2a) zakłada się, że wektor E₀ nie zależy od czasu, zachowując stałą wartość i stały kierunek w przestrzeni; tego rodzaju falę nazywamy falą spolaryzowaną liniowo, stąd indeks p (polaryzacja) dla wersora ep. Ogólnie E₀ = epE₀exp(iφ) przedstawia zespoloną amplitudę pola elektrycznego, gdzie exp(iφ) jest czynnikiem przesunięcia fazowego, wektor k nosi nazwę wektora falowego. Jako że E₀ = constans, wobec tego w danej chwili t taki sam stan oscylacji pola E(r,ωt) występuje w punktach, dla których iloczyn skalarny
k⋅r = kxx + kyy + kzz = constans.
Jest to równanie płaszczyzny frontu falowego, na którym wektory E drgają w tej samej fazie, stąd płaszczyzny stanowią powierzchnie ekwifazowe, tj. powierzchnie stałej fazy – patrz rys. 2.1.
Rys. 2.1. Fala płaska harmoniczna opisana równaniem (2.2a). Fronty falowe będące powierzchniami ekwifazowymi określane są zależnością k⋅r = constans. Wektor falowy k = (2π/λ)en o kierunku wersora normalnego en wskazuje kierunek propagacji fali
Rozpisując iloczyn skalarny k⋅r na składowe, równanie (2.2a) monochromatycznej fali płaskiej przybiera postać
E(r,ωt) = E₀exp(iωt)⋅exp.
(2.2b)
Pokażemy dalej, że wzór (2.2a) spełnia równanie falowe (2.1a). Wielką korzyścią zapisu zespolonego jest łatwość różniczkowania. Dla funkcji exp(iωt) występuje w takim przypadku przyporządkowanie ∂/∂t → iω, w wyniku czego z (2.1a) uzyskuje się natychmiast (2.1b). W przypadku zmiennych przestrzennych działanie operatorem nabla na wektor E = E₀exp(-ik⋅r) jest równoważne mnożeniu przez -ik, czyli ⋅E = -ik⋅E, co oznacza odpowiedniość → -ik. Przyporządkowanie powyższe stosuje się dla każdej operacji zawierającej operator nabla, tj. dla operatora Laplace’a, operatorów gradientu, rotacji i dywergencji.
Przykład 2.1
W celu wykazania, że → -ik wystarczy obliczyć iloczyn ⋅E, rozpisując na składowe operator nabla = ex∂x + ey∂y + ez∂z oraz wektor E(r) = (E0xex + E0yey + E0zez)⋅e-ik⋅r. Traktując operator jak wektor, otrzymujemy jak dla iloczynu skalarnego
⋅E = E0x∂xe-ik⋅r + E0y∂ye-ik⋅r + E0z∂ze-ik⋅r =
= -ikxE0xe-ik⋅r - ikyE0ye-ik⋅r - ikzE0ze-ik⋅r =
= -i(kxE0x + kyE0y + kzE0z) e-ik⋅r = -ik⋅E(r).
W przypadku operatora Laplace’a (nabla kwadrat) na podstawie powyższego równania znajduje się
⋅(⋅E) = ⋅(-ik⋅E) = -ik⋅E = -k⋅k⋅E = -k²E.
Wykorzystując podane przyporządkowania, po wstawieniu (2.2a) do równania (2.1) uzyskuje się natychmiast
,
(2.3)
skąd wynika, że zależność (2.2a) spełnia równanie falowe, pod warunkiem że
.
(2.4)
Współczynnik nosi nazwę współczynnika załamania ośrodka, który dla próżni (εr.=.1, μr.=.1) równy jest jedności. Wektor k = k⋅en jest wektorem falowym o kierunku prostopadłym do płaskiego frontu falowego, gdzie en oznacza wersor normalny do czoła fali.
Wartość wektora |k| = k = 2π/λ zwana jest liczbą falową; wielkości z indeksem zero, tj. k₀ = ω/c, λ₀ oznaczają wartości dla próżni, λ = λ₀/n przedstawia długość fali w ośrodku. Zgodnie ze wzorem (2.2a), analogicznie do częstości czasowej ω = 2π/T , liczba falowa k ma sens częstości przestrzennej . Składowe wektora k = , można wyrazić poprzez kosinusy kierunkowe kątów αx, αy, αz, jakie wektor k tworzy z osiami układu współrzędnych, czyli k = k₀. Zachodzi zależność
k⋅k = k² = kx² + ky² + kz².
Dla dielektryka, przy założeniu μr = 1, współczynnik załamania ośrodka można zapisać
.
(2.5)
Generalnie stałe optyczne εr i n są funkcjami częstości fali, tj. εr = εr(ω), n = n(ω), i przedstawiają zależności dyspersyjne. Stałe te wygodnie jest zapisywać jako liczby zespolone. Jak zobaczymy dalej, część urojona stałych optycznych określa w takim wypadku stratność ośrodka.
Na powierzchni płaskich frontów falowych wartość wektora E określona jest przez funkcję fazową, zwykle zwaną krótko fazą: φ = ωt - k⋅r. W celu ustalenia, z jaką prędkością poruszają się fronty falowe, należy śledzić płaszczyznę o danej fazie, co matematycznie wyraża równanie φ = ωt - k⋅r = constans. Różniczkując obie strony powyższego równania po czasie i zapisując wektor k = ken, otrzymuje się (dr/dt)en = ω/k. Po przemnożeniu przez en znajdujemy
,
(2.6a)
a posługując się długością fali λ = λ₀n = 2π/k i częstotliwością f = 2π/ω
.
(2.6b)
Równania (2.6) określają prędkość fazową fali harmonicznej. Ze względu na zależność dyspersyjną n(ω) prędkość fazowa również jest funkcją częstości. Kierunek wektora prędkości fazowej pokrywa się z wersorem en normalnym do płaszczyzny frontu falowego. W tabeli 2.1 zamieszczono kilka przykładów ośrodków dielektrycznych z podaniem wartości współczynnika załamania i prędkości fazowych fali świetlnej.
Tabela 2.1. Prędkości fazowe w wybranych ośrodkach dielektrycznych
------------- ------------------------- -------------------------
Materiał Współczynnik załamania* Prędkość fazowa światła
próżnia 1 c
powietrze 1,0003 0,9997c
czysta woda 1,33 0,75c
szkło 1,5-1,7 (0,67-0,59)c
diament 2,42 0,41c
------------- ------------------------- -------------------------
* Współczynnik załamania podawany dla linii D sodu (589 nm)
2.2. Fala elektromagnetyczna jako fala poprzeczna (TEM)
Równania Maxwella pozwalają na wyznaczenie wszystkich właściwości fali elektromagnetycznej (EM). Zakładając ośrodek jednorodny (εr = constans) i podstawiając wzór (2.2a) na falę harmoniczną zapisany dla pól E i H, odpowiednio do równań Maxwella (1.62c), (1.62d), tj. ⋅E = 0 i ⋅H = 0, przy wykorzystaniu przyporządkowania → -ik, uzyskuje się:
k⋅E(r,ωt) = 0, k⋅H(r,ωt) = 0 .
(2.7)
Równania (2.7) pokazują, że wektory E i H są prostopadłe do wektora falowego k, czyli do kierunku propagacji. Oznacza to, że płaska fala EM jest falą poprzeczną (ang. transverse electromagnetic, TEM). Z kolei podstawienie (2.2a) do równań Maxwella (1.62a) i (1.62b) prowadzi, odpowiednio dla par wektorów E, H i E, B, do wyrażeń:
k × E(r,ωt) = ωμ₀μrH(r,ωt), -k × H(r,ωt) = ωε₀εrE(r,ωt),
(2.8a)
k × E(r,ωt) = ωB(r,ωt), -k × B(r,t) = ωε₀εrμ₀μr E(r,ωt).
(2.8b)
Z powyższych równań wynika dodatkowa informacja, że trójka wektorów: E, H, k lub E, B, k dla fali płaskiej tworzy układ wektorów wzajemnie ortogonalnych - patrz rys. 2.2.
Ponieważ zgodnie z (2.4) , więc na podstawie (2.8a) znajdujemy, że wartości wektorów E i H pozostają w każdej chwili w tym samym stosunku
.
(2.9)
Wielkość Z nosi nazwę impedancji falowej ośrodka, a Z₀ - impedancji falowej próżni o wartości
= 120π ≈ 377 Ω.
(2.10)
W dielektryku bezstratnym i niemagnetycznym (μr = 1), dla którego n² = εr, mamy Z = Z₀/n = 1/(ε₀cn).
Rys. 2.2. Orientacja wektorów pola względem wektora falowego k dla fali płaskiej w ośrodku jednorodnym, izotropowym. W myśl wzorów (2.8) iloczyn k×E wskazuje kierunek H, natomiast k×H wskazuje kierunek -E. W ośrodku izotropowym wektory D i E oraz B i H są wzajemnie równoległe. W ośrodkach anizotropowych wektor polaryzacji P nie jest ogólnie skierowany zgodnie z wektorem pola E, stąd wektor indukcji elektrycznej D = ε₀E + P nie będzie równoległy do E. Kierunek wektora Poyntinga S = E×H pokrywa się z kierunkiem wektora falowego
Z zależności (2.9) wynika, że natężenie pola magnetycznego dla fali płaskiej jest równe
,
(2.11a)
a jeśli dla pola magnetycznego posłużyć się wektorem B = μ₀μrH, wtedy
.
(2.11b)
Jak widać, wektory E i vf.B mają takie same wartości. Relacje (2.9), (2.11) pozostają słuszne dla wektorów pól w każdej chwili, w szczególności obowiązują dla amplitud E₀, H₀, B₀.
Podsumowując, wektory pola elektrycznego i magnetycznego dla płaskiej harmonicznej fali EM można zapisać w postaci:
,
(2.12a)
.
(2.12b)
W ośrodku bezstratnym εr i μr wyrażone są przez liczby rzeczywiste i pola E i H oscylują w tej samej fazie (rys. 2.3). W ośrodku niemagnetycznym i stratnym przenikalność εr wyraża się liczbą zespoloną; w takim wypadku, jak zobaczymy dalej, pojawia się przesunięcie fazowe pomiędzy polami E i H.
Nieograniczona w czasie i przestrzeni matematyczna fala płaska TEM stanowi teoretyczne rozwiązanie równania falowego, ale fizycznie jest nierealizowalna. Fala taka, mając skończoną gęstość mocy na jednostkę nieskończonej powierzchni, przenosiłaby nieskończoną moc, ponadto jako fala harmoniczna byłaby reprezentowana przez nieskończony ciąg falowy.
Rys. 2.3. Spolaryzowana liniowo, płaska, harmoniczna fala elektromagnetyczna w dielektryku bezstratnym – wzajemnie prostopadłe wektory pól E i H oscylują w fazie. Linie pola E i H „zamykają się” w nieskończoności. Iloczyn wektorowy E×H = S określa wektor Poyntinga przedstawiający gęstość strumienia energii (W/m²) fali EM
Linie pól E i H, będącymi polami o niezerowej rotacji, powinny być liniami zamkniętymi. W przypadku fali płaskiej linie te „zamykają się” w nieskończoności. Tym niemniej fala płaska jest niezwykle użytecznym obiektem matematycznym, a w wielu przypadkach stanowi także dobre praktyczne przybliżenie, ponieważ w odpowiednio dużej odległości od źródła front falowy różnych fal może być lokalnie rozważany jako płaski – patrz p. 2.4.2.
Należy zauważyć, że z odmienną sytuacją mamy do czynienia, gdy fala nie propaguje się w ośrodku jednorodnym, ale w niejednorodnym. W optyce dobrze znanym przykładem takich struktur są m.in. światłowody dielektryczne. W takim wypadku fale EM świetlne nie są falami typu TEM. Mogą to być fale tzw. typu TE (ang. transverse electric), gdy w płaszczyźnie prostopadłej do kierunku propagacji poprzeczna jest tylko składowa elektryczna, natomiast w kierunku propagacji występuje składowa H ≠ 0, lub tzw. fale TM (ang. transverse magnetic), gdy poprzeczna jest tylko składowa magnetyczna, natomiast w kierunku propagacji składowa E ≠ 0. W celu przybliżenia obrazu rozkładu pól tego typu fal na rys. 2.4 przedstawiono schematycznie linie pola E i H dla fal TE i TM w najprostszej strukturze falowodowej, którą stanowi falowód planarny jednowymiarowy (1D) (ang. one-dimensional).
Rys. 2.4. Ilustracja fal niebędących falami TEM w ośrodku niejednorodnym w postaci falowodu planarnego 1D. Pokazano planarną warstwę prowadzącą, czyli rdzeń falowodu (szerokość rdzenia w kierunku y jest formalnie nieskończona) oraz linie pola elektromagnetycznego dla fal TE i TM. Dla polaryzacji TE składowe pola to E = i H = , podczas gdy dla polaryzacji TM są to składowe H = i E = . Dla uzyskania efektu prowadzenia światła w rdzeniu musi zachodzić warunek n₂ > n₁, n₃. Wektor Poyntinga S wskazuje kierunek transportu energii
Pokazany na rysunku falowód składa się z dielektrycznej warstwy prowadzącej światło, zwanej rdzeniem o grubości h rzędu długości fali, umieszczonej między podłożem a pokryciem - ośrodkami dielektrycznymi o mniejszych współczynnikach załamania. Określenie jednowymiarowy oznacza, że fala świetlna uwięziona jest tylko w kierunku poprzecznym rdzenia, natomiast ulega dyfrakcyjnemu poszerzeniu w płaszczyźnie warstwy - na rys. 2.4 jest to kierunek osi y. Do falowodu planarnego powrócimy w p. 5.2.3 przy okazji omawiania prędkości fali, a w p. 5.5.2 zostaną scharakteryzowane krótko światłowody cylindryczne stosowane powszechnie w telekomunikacji optycznej. Na koniec wypada wspomnieć, że oprócz fal TE i TM prowadzonych w falowodach 1D znane są fale hybrydowe HE, EH powstające w falowodach dwuwymiarowych (2D) paskowych lub kanałowych, stosowanych powszechnie w urządzeniach optyki scalonej, gdzie w kierunku propagacji występuje zarówno składowa E, jak i H.
Przykład 2.2
Wyżej rozważano falę płaską o dowolnej orientacji względem układu współrzędnych. Często zakłada się, że taka fala biegnie wzdłuż jednej z osi układu współrzędnych. Rozpatrzymy tutaj dodatkowo ten szczególny przypadek, ponieważ taki wybór kierunku propagacji pozwala na prostsze wyprowadzenie właściwości fali.
Dla ustalenia uwagi weźmy falę płaską biegnącą w kierunku +z, tj. falę o wektorze falowym k = kzez. Ponieważ w każdym punkcie płaszczyzny ekwifazowej wektor E (podobnie H) jest tak samo zorientowany, nie ma zmiany w rozkładzie wektora w kierunkach x i y, czyli wektory E i H zależą tylko od współrzędnej z oraz od czasu. Pomijając dla uproszczenia zapisywanie czynnika exp(iωt), dla wektora E mamy
E(z) = E₀e-ikz = (E0xex + E0yey + E0zez) e-ikz, ∂xE = ∂yE = 0.
(i)
Takie same równania zapisuje się dla wektora H. Z równania Maxwella (1.62c): ⋅E = 0, po rozpisaniu iloczynu po prawej strony na składowe otrzymujemy
⋅E = ex⋅∂xE + ey⋅∂yE + ez⋅∂zE = 0 + 0 + ez⋅∂zE = -ikE0ze-ikz = 0,
(ii)
skąd wynika E0z = 0. Analogicznie z równania ⋅H = 0 otrzymuje się H0z = 0. Oznacza to, że E, H ^ k, czyli fala jest falą poprzeczną typu TEM.
W celu ustalenia wzajemnej orientacji wektorów E i H załóżmy polaryzację liniową fali, przyjmując wektor pola elektrycznego w postaci E = (0, E₀e-ikz, 0). Korzystając z równania (1.62a): ×E = -iμωH, po rozpisaniu lewej strony równania według wyznacznika, mamy
.
(iii)
Porównując składowe, widać, że H0y = 0, zatem dla pola magnetycznego istnieje tylko składowa o wartości H0x = H₀ = (k/μω)E₀, gdzie μ = μ₀μr. Wynika stąd, że pola E i H są wzajemnie prostopadłe: E ^ H. Włączając do zapisu człon czasowy exp(iωt), dla rozważanej fali płaskiej otrzymujemy ostatecznie:
E(z,ωt) = eyE₀exp, H(z,ωt) = -ex(k/μω)E₀exp.
(2.13)
W powyższym wyprowadzeniu nie skorzystano z równania (1.62b): ×H = iεωE, dlatego w (2.13) nie pojawia się stała ε oraz nie jest wyznaczany wektor falowy – por. wzór (2.4).
Front falowy z fazą φ = ωt - kz = constans porusza się z prędkością fazową vf = dz/dt = ω/k = c/n. Znak minus we wzorze na fazę φ odpowiada fali biegnącej w prawo, jako że dla utrzymania stałej wartości fazy w miarę zwiększania czasu t musi rosnąć także wartość współrzędnej z. Znak plus odpowiadałby fali biegnącej w lewo, wówczas dla H w (2.13) należy zmienić znak +ex.
W kontekście analizy rozwiązań równania falowego warto podkreślić, że równania Maxwella zwykle nakładają na wektory E i H określone warunki, które nie zawierają się w samym równaniu falowym. Inaczej mówiąc, nie każde rozwiązanie spełniające równanie falowe będzie zgodne z równaniami Maxwella. Niech za przykład posłuży hipotetyczna, harmoniczna fala podłużna o wektorze pola elektrycznego E = (0, 0, E₀)⋅exp = ezE₀exp. Łatwo sprawdzić, że wektor tej postaci stanowi rozwiązanie równania falowego (2.1a) lub (2.1b), podobnie jak każda podwójnie różniczkowalna funkcja argumentu (z - vt) - por. p. 1.7.3. Równocześnie podstawienie postulowanego rozwiązania do równania Maxwella ⋅E = 0 prowadzi do sprzeczności, ponieważ wszystkie składowe należałoby przyjąć jako zerowe – por. (ii). Z kolei obliczenie jak w równaniu (iii) rotacji ×E daje zero, co na mocy równania ×E = -iμωH oznacza H = 0, czyli nie istnieje dozwolone pole H o częstości ω. Widać więc, że rozwiązanie równania falowego w postaci fali podłużnej jest zakazane przez równania Maxwella. Z drugiej strony fale podłużne stanowią poprawne rozwiązania formalnie identycznego równania falowego dla fal mechanicznych w ośrodku jednorodnym, jednak w tym przypadku nie ma ograniczeń nakładanych na rozwiązania przez dodatkowe równania, które byłyby analogiem równań Maxwella.