Teorema Inversi Fundamental dan Fungsi Implisit
1. Bentuk Aturan Rata-Rata untuk Fungsi Vektor
Dalam bagian ini kita memperoleh sebuah perampatan dari aturan rata-rata, dan sebuah penerapannya dalam bentuk suatu ketaksamaan; keduanya berlaku untuk fungsi-fungsi yang terdiferensialkan dari ℝⁿ ke ℝᵐ. Kita memerlukan gagasan tentang segmen garis di ℝⁿ yang ditentukan oleh dua titik, u dan v. Segmen ini terdiri dari semua titik dalam bentuk
x = u + t(v – u) di mana 0 ≤ t ≤ 1.
Segmen garis di atas adalah tertutup karena memuat kedua titik ujungnya. Kita kadang-kadang menyatakannya dengan [u, v]. Segmen terbuka yang bersesuaian, yang kita nyatakan dengan (u, v), diperoleh dengan membatasi t pada interval terbuka 0 < t < 1. Situasinya digambarkan dalam sebagai berikut:
Vektor v – u membentang dari u ke v, sehingga jika 0 < t < 1, u ditambah t kali (v – u) berakhir di beberapa titik pada segmen dari u ke v. Seiring meningkatnya t dari 0 ke 1, x bergerak dari u ke v.
A. Perampatan Aturan Rata-Rata
Misalkan f adalah fungsi dari himpunan terbuka G di ℝⁿ ke ℝᵐ. Misalkan u dan v adalah dua titik di G sedemikian sehingga segmen garis tertutup [u, v] terletak di G. Misalkan f kontinu pada setiap titik di segmen tertutup tersebut dan terdiferensialkan pada setiap titik di segmen terbuka (u, v). Maka untuk setiap vektor w di ℝᵐ bersesuaian dengan sebuah vektor ξ yang berakhir pada segmen terbuka (u, v) sedemikian sehingga
[f(v) – f(u)] · w = [f'(ξ)(v – u)] · w
Bukti:
Definisikan sebuah fungsi F dari t dari [0, 1] ke ℝᵐ dengan F(t) = f[u + t(v – u)]. Sangat mudah untuk melihat bahwa F kontinu pada [0, 1] dan terdiferensialkan pada (0, 1). Kita dapat menganggap F'(t) sebagai sebuah vektor di ℝᵐ. Dalam kasus khusus ini, berdasarkan aturan rantai,
F'(t) = f'[u + t(v – u)](v – u)
ketika 0 < t < 1, di mana nilai dari turunan f merupakan anggota dari ℒ(ℝⁿ, ℝᵐ) yang bekerja pada v – u. Sekarang ambil sebarang vektor w di ℝᵐ dan tinjau fungsi bernilai riil φ(t) = w · F(t). Sangat mudah untuk melihat bahwa φ kontinu pada [0, 1] dan terdiferensialkan pada (0, 1); terlebih lagi, dapat dibuktikan dengan mudah bahwa φ'(t) = w · F'(t). Sekarang, secara jelas terlihat bahwa
φ(1) – φ(0) = [f(v) – f(u)] · w
Karena φ hanyalah sebuah fungsi terdiferensialkan dari ℝ ke ℝ, aturan rata-rata yang biasa memberi tahu kita bahwa terdapat suatu bilangan θ sedemikian sehingga 0 < θ < 1 dan
φ(1) – φ(0) = φ'(θ)(1 – 0) = φ'(θ)
Dengan demikian kita melihat bahwa
[f(v) – f(u)] · w = {f'[u + θ(v – u)](v – u)} · w
Dengan memisalkan ξ = u + θ(v – u) kita memperoleh bentuk yang diinginkan.
B. Bentuk Ketaksamaan untuk Aturan Rata-Rata
Misalkan f adalah fungsi dari himpunan terbuka G di ℝⁿ ke ℝᵐ. Misalkan u dan v adalah dua titik di G sedemikian sehingga segmen garis tertutup [u, v] terletak di G. Misalkan f kontinu pada setiap titik di segmen tertutup tersebut dan terdiferensialkan pada setiap titik di segmen terbuka (u, v). Maka terdapat suatu titik ξ pada segmen garis yang menghubungkan u dan v sedemikian sehingga
‖f(v) – f(u)‖ ≤ ‖f'(ξ)(v – u)‖
di mana ‖ ‖ tentu saja menyatakan norma Euclidean yang biasa.
Bukti:
Jika f(u) = f(v), maka pernyataan ini secara jelas bernilai benar, karena ‖0‖ = 0 dan norm dari setiap vektor bernilai nonnegatif. Jika f(u) ≠ f(v), kita mulai dengan mengambil nilai mutlak dari masing-masing ruas pada perampatan aturan rata-rata dan menerapkan ketaksamaan Cauchy pada ruas kanan
|[f(v) – f(u)] · w| = |[f'(ξ)(v – u)] · w| ≤ ‖f'(ξ)(v – u)‖ ‖w‖ ...(i)
Kemudian kita memilih w sebagai berikut:
w = (f(v) – f(u)) ÷ ‖f(v) – f(u)‖
Seperti yang dapat kita lihat, ‖w‖ = 1 dan
|[f(v) – f(u)] · w| = ‖f(v) – f(u)‖² ÷ ‖f(v) – f(u)‖ = ‖f(v) – f(u)‖
Dengan memasukkan hasil-hasil ini ke dalam (i), kita memperoleh bentuk yang diinginkan.
2. Matriks Hessian dan Nilai Ekstrim
Mari kita tinjau bentuk kuadratik dalam n variabel, fungsi seperti itu dapat dinyatakan sebagai:
Q(h₁, ..., hₙ) = a₁₁h₁² + a₁₂h₁h₂ + ··· + a₁ₙh₁hₙ + a₂₁h₂h₁ + a₂₂h₂² + ··· + a₂ₙh₂hₙ + ... + aₙ₁hₙh₁ + ··· + aₙₙhₙ²
Kita bisa saja mengasumsikan bahwa aᵢⱼ = aⱼᵢ, dan hal ini biasanya dilakukan. Dengan memanfaatkan notasi matriks dan aturan perkalian matriks, kita dapat menyajikan bentuk kuadratik tersebut secara lebih mudah melalui
Q(h₁, ..., hₙ) = hᵀAh
di mana hᵀ dianggap sebagai matriks (1 × n), A adalah matriks n × n (aᵢⱼ), dan vektor h dianggap sebagai matriks (n × 1). Hasil kali dari tiga matriks seperti ini, dalam urutan ini, didefinisikan dan menghasilkan sebuah skalar. Skalar dalam kasus ini adalah bentuk kuadratik tersebut.
Dalam teori nilai maksimum dan minimum, ekspansi deret Taylor untuk fungsi dengan beberapa variabel ini biasanya dibuat di sekitar titik kritis dari fungsi tersebut, di mana semua turunan parsial pertama bernilai nol. Misalkan kita mengekspansikan f(x₁, ..., xₙ) di sekitar titik kritis a = (a₁, ..., aₙ). Karena koefisien dari semua suku linear bernilai nol, deret tersebut dimulai sebagai berikut:
f(x₁, ..., xₙ) = f(a₁, ..., aₙ) + [½(h₁ ∂/∂x₁ + ··· + hₙ ∂/∂xₙ)²f]ₓ₌ₐ + ···
di mana hₖ = xₖ – aₖ. Suku kedua dapat ditulis sebagai ½Q(h₁, ..., hₙ), di mana Q adalah bentuk kuadratik dalam h, yang memiliki turunan parsial orde kedua dari f yang dievaluasi di a sebagai koefisien-koefisiennya. Faktanya, ini persis merupakan bentuk kuadratik jika kita mengambil aᵢⱼ sebagai ∂²f/(∂xᵢ∂xⱼ), yang dievaluasi di a. Deret di atas kemudian dapat ditulis menjadi
f(x₁, ..., xₙ) = f(a₁, ..., aₙ) + ½hᵀAh + ···
Matriks A ini disebut sebagai matriks Hessian dari f di a.
Fungsi f memiliki minimum lokal pada titik-titik kritis di mana hᵀAh bersifat definit positif, dan maksimum lokal pada titik-titik kritis di mana bentuk kuadratik ini bersifat definit negatif. Terdapat sebuah aturan untuk menentukan apakah suatu bentuk kuadratik bersifat definit positif, dan sebuah aturan untuk mengetahui apakah ia definit negatif.
Karena bentuk kuadratik Q dan matriks simetris A yang merepresentasikannya saling menentukan satu sama lain secara penuh, merupakan praktik yang umum untuk menyatakan kedefinitan positif dan kedefinitan negatif pada matriks simetris riil maupun pada bentuk kuadratik yang direpresentasikannya. Kita harus selalu mengingat, tentu saja, bahwa sebagian besar matriks simetris dan bentuk kuadratik tidak bersifat definit positif maupun definit negatif. Hal ini tercermin dari keberadaan titik-titik kritis yang di sana tidak terdapat minimum lokal maupun maksimum lokal (titik pelana).
Misalkan f adalah fungsi dari himpunan terbuka U di ℝⁿ ke ℝ, yang memiliki turunan parsial pertama dan kedua yang kontinu. Untuk menemukan nilai ekstrim lokal dari f di U, pertama-tama kita mencari titik-titik kritisnya. Kemudian kita menyusun matriks Hessian pada setiap titik kritis tersebut.
Pada titik-titik kritis di mana Hessian bersifat definit positif, f mencapai nilai yang merupakan minimum lokal. Sedangkan pada titik-titik kritis di mana matriks ini bersifat definit negatif, f memiliki maksimum lokal.
Hessian dari f pada sebarang x sebenarnya merupakan nilai f''(x) dari turunan kedua f di x; ia merupakan sebuah transformasi linear dari ℝⁿ ke ℝⁿ. Kita ingat kembali bahwa f adalah fungsi dari ℝⁿ ke ℝ dan bahwa f'(x) adalah gradien dari f di x, dengan grad f menjadi fungsi dari ℝⁿ ke ℝⁿ. Oleh karena itu, turunan dari grad f adalah fungsi dari ℝⁿ ke ℒ(ℝⁿ, ℝⁿ); matriks Jacobian yang merepresentasikan turunan dari grad f (dan turunan kedua dari f) adalah apa yang kita sebut sebagai matriks Hessian dari f. Nama ini berasal dari seorang matematikawan Jerman, Otto Hesse (1811–1874). Perhatikan kemiripan yang mencolok antara kondisi cukup kita untuk minimum relatif dari f di a dengan kondisi yang bersesuaian untuk kasus fungsi dari satu variabel riil.
3. Fungsi Diferensiabel Kontinu
Sekarang kita meninjau lebih lanjut mengenai suatu fungsi f dari himpunan terbuka U di ℝⁿ ke ℝᵐ. Kita asumsikan bahwa f terdiferensialkan di U, artinya, f'(x) ada pada setiap titik di U. Kita terkadang menyatakan turunan ini dengan Tₓ atau cukup dengan T untuk mengingatkan kita bahwa ia merupakan transformasi linear dari ℝⁿ ke ℝᵐ, yaitu T ∈ ℒ(ℝⁿ, ℝᵐ).
Ketika kita sampai pada teorema fungsi invers, kita akan melihat pentingnya mengetahui kapan turunan f', dari U ke ℒ(ℝⁿ, ℝᵐ), merupakan fungsi yang kontinu. Untuk kekontinuan f' pada suatu titik a, persyaratannya adalah bahwa ‖f'(x) – f'(a)‖ mendekati nol seiring ‖x – a‖ mendekati nol. Karena f'(x) – f'(a) merupakan anggota dari ℒ(ℝⁿ, ℝᵐ), kita menggunakan norm untuk ruang tersebut. Ketika fungsi f' kontinu, f dikatakan terdiferensialkan kontinu (continuously differentiable).
Ternyata ada cara mudah untuk menguji f guna mengetahui apakah ia terdiferensialkan kontinu, yaitu dengan memeriksa turunan parsial pertama dari fungsi komponen skalar f⁽¹⁾, f⁽²⁾, ..., f⁽ᵐ⁾ dari fungsi bernilai vektor f. Merupakan suatu kebiasaan untuk mengatakan bahwa fungsi f termasuk dalam kelas C⁽¹⁾ di U jika masing-masing turunan parsial pertama dari setiap fungsi komponen bersifat kontinu di U. Turunan-turunan parsial ini, yang banyaknya ada m × n, berada dalam matriks.
A. Teorema Pengujian Fungsi Diferensiabel Kontinu
Syarat perlu dan cukup agar f terdiferensialkan kontinu di U adalah f termasuk dalam kelas C⁽¹⁾ di U.
Bukti:
Misalkan x dan a adalah titik-titik di U. Maka f'(x) – f'(a) adalah transformasi linear yang matriksnya memiliki selisih fⱼ⁽ⁱ⁾(x) – fⱼ⁽ⁱ⁾(a) sebagai elemen pada baris ke-i dan kolom ke-j. Sekarang misalkan
K(x) = max |fⱼ⁽ⁱ⁾(x) – fⱼ⁽ⁱ⁾(a)| ...(i)
(di mana maksimum diambil untuk 1 ≤ i ≤ m dan 1 ≤ j ≤ n)
Pertimbangkan K(x) ≤ ‖f'(x) – f'(a)‖ ≤ √mn K(x) ...(ii)
Bukti dari teorema kita langsung diperoleh dari ketaksamaan-ketaksamaan ini; sebab, mengatakan bahwa turunan-turunan parsial kontinu di x = a adalah setara dengan mengatakan bahwa K(x) → 0 seiring x → a; kita melihat hal ini dari (i). Namun kita melihat bahwa K(x) → 0 seiring x → a jika dan hanya jika ‖f'(x) – f'(a)‖ → 0 seiring x → a.
4. Teorema Inversi Fundamental
Teorema ini membahas tentang sistem n persamaan yang memetakan sebuah vektor (x₁, x₂, ..., xₙ) di ℝⁿ ke dalam vektor (y₁, y₂, ..., yₙ) yang juga berada di ℝⁿ. Kita menuliskan sistem tersebut sebagai
f⁽¹⁾(x₁, ..., xₙ) = y₁
f⁽²⁾(x₁, ..., xₙ) = y₂
···
f⁽ⁿ⁾(x₁, ..., xₙ) = yₙ
Sekarang kita mengasumsikan m = n. Jika fungsi-fungsi komponennya merupakan fungsi linear dari xᵢ, sistem ini dapat ditangani dengan aljabar linear. Namun, kita ingin menghadapi kasus yang lebih umum di mana f⁽ⁱ⁾ tidak harus linear. Kita akan menggunakan notasi vektor dan metode vektor. Kita menuliskannya sebagai
f(x) = y ...(i)
dan mengasumsikan bahwa domain definisi dari f adalah lingkungan 𝒩 dari suatu titik a. Kita asumsikan bahwa f kontinu pada setiap titik di 𝒩. Maka a dipetakan ke f(a) dan 𝒩 dipetakan ke dalam suatu himpunan (citra dari 𝒩) yang kita nyatakan dengan f(𝒩). Teorema yang akan kita bahas ini adalah tentang menyatakan x sebagai fungsi dari y; atau mungkin lebih baik dikatakan bahwa teorema ini adalah tentang cara mengetahui kapan hubungan antara x dan y dapat dianggap sebagai hubungan di mana x adalah fungsi dari y. Asumsi-asumsi dan pembatasan-pembatasan tertentu harus diterapkan untuk memperoleh hasil yang berguna. Jika tidak, fungsi f mungkin tidak menghasilkan hubungan satu-satu antara 𝒩 dan f(𝒩), dua atau lebih x dapat dipetakan ke dalam y yang sama, dan dalam kasus seperti itu x tidak ditentukan secara unik oleh y.
Dalam kasus sistem linear, f(x) = y dapat ditulis dalam bentuk Ax = y, di mana A menyatakan matriks konstanta aᵢⱼ berukuran n × n. Kita tahu bahwa sistem linear menentukan pemetaan satu-satu dari ℝⁿ pada seluruh ℝⁿ jika determinan dari matriks A tidak nol, dan bahwa jika demikian maka x dapat dinyatakan sebagai fungsi dari y dalam bentuk x = A⁻¹y, di mana A⁻¹ adalah matriks invers.
Pertanyaan pertama yang kita ajukan adalah ini: Bagaimana kita bisa memperoleh suatu kondisi pada fungsi f yang akan menjadi perampatan yang cocok dari kondisi bahwa matriks A memiliki determinan tidak nol? Kita bisa mendapatkan jawabannya dengan mengasumsikan bahwa f terdiferensialkan.
Kemudian, jika x adalah titik di 𝒩 yang dekat dengan a, selisih f(x) – f(a) secara aproksimasi sama dengan T₀[x – a], di mana T₀ = f'(a) merupakan anggota dari ℒ(ℝⁿ). Hal ini menunjukkan agar kita mempertimbangkan apakah operator linear T₀ dapat diinverskan. Faktanya, mari kita tinjau apa itu T₀ dalam kasus khusus di mana y = f(x) mengambil bentuk linear y = Ax. Dalam kasus itu
f⁽ⁱ⁾(x₁, ..., xₙ) = aᵢ₁ x₁ + ··· + aᵢₙ xₙ
dan ∂f⁽ⁱ⁾/∂xⱼ = aᵢⱼ, sehingga matriks A persis merupakan matriks turunan parsial yang dievaluasi di a. Jadi A = T₀ dalam kasus khusus ini. Jika T₀ dapat diinverskan, persamaan y – f(a) = T₀[x – a] dapat diselesaikan secara unik untuk x – a dalam bentuk y – f(a), dan adalah hal yang wajar untuk mempertanyakan apakah ini mengimplikasikan bahwa y = f(x) dapat diselesaikan secara unik untuk x dalam bentuk y jika kita membatasi semua pertimbangan kita pada x di dekat a dan y di dekat f(a).
Kasus yang sangat sederhana di mana n = 1 dapat memberikan gambaran. Dalam kasus ini, jika kita mengasumsikan bahwa kurva y = f(x) mulus, yang berarti bahwa turunan f'(x) kontinu, maka potongan kecil dari kurva y = f(x) di dekat x = a, y = f(a) terlihat sangat mirip dengan garis singgung y – f(a) = f'(a)(x – a). Dalam kasus ini, jika f'(a) ≠ 0, persamaan linear tersebut dapat diselesaikan untuk x, dan juga benar bahwa, untuk nilai x yang cukup dekat dengan x = a, hubungan antara x dan y adalah satu-satu.
Gambar tersebut menunjukkan bahwa hubungan antara x dan y tidak harus satu-satu untuk semua nilai x; pada gambar, kita melihat bahwa f(x₁) = f(a) = f(x₂) = f(x₃), dan oleh karena itu ada empat nilai x untuk nilai y yang sama yaitu f(a).
Kita sekarang siap untuk menyatakan teorema utama. Kita bergantung pada kondisi bahwa f terdiferensialkan di seluruh himpunan terbuka dan memiliki turunan yang kontinu setidaknya pada satu titik di himpunan tersebut di mana f' adalah operator yang dapat diinverskan. Untuk memperoleh kesimpulan yang diinginkan, kita harus membatasi nilai x pada suatu lingkungan dari titik tersebut, dan lingkungan yang terbatas ini (secara umum) hanya akan menjadi bagian dari himpunan terbuka tempat kita memulai.
A. Teorema Inversi Fundamental
Misalkan f adalah fungsi yang terdiferensialkan dari himpunan terbuka 𝒩 di ℝⁿ ke ℝⁿ, dan andaikan terdapat suatu titik a di 𝒩 yang di sana turunannya, f', bersifat kontinu. Misalkan lebih lanjut bahwa operator linear f'(a) dapat diinverskan. Maka terdapat di 𝒩 suatu lingkungan U dari a sedemikian sehingga:
1. f memetakan setiap pasang titik yang berbeda di U ke dalam dua titik yang berbeda di ℝⁿ.
2. Himpunan citra f(U), yang terdiri dari semua titik f(x) untuk x ∈ U, adalah himpunan terbuka.
3. Pemetaan invers f⁻¹, yang didefinisikan pada f(U) oleh f⁻¹(y) = x di mana x adalah titik unik di U sedemikian sehingga y = f(x), bersifat terdiferensialkan pada setiap titik di f(U); dan jika kita menuliskan f'(x) = T dan menyatakan f⁻¹ demi kenyamanan dengan g, maka g'(y) = T⁻¹.
4. f⁻¹ terdiferensialkan kontinu pada f(a), dan jika f kebetulan terdiferensialkan kontinu pada titik-titik x lainnya di U, maka f⁻¹ terdiferensialkan kontinu pada titik-titik f(x) yang bersesuaian di f(U).
B. Komentar Teorema Inversi Fundamental
1. Keterbalikan (invertibilitas) dari suatu sistem persamaan simultan nonlinear dapat disimpulkan dari keterbalikan sistem linear yang terkait erat.
2. Teorema inversi fundamental bersifat lokal, bukan global. Artinya, teorema ini hanya menarik kesimpulan tentang apa yang terjadi di suatu lingkungan yang cukup kecil dari sebuah titik. Sebaliknya, aturan Cramer adalah teorema global tentang sistem persamaan linear simultan.
3. Teorema inversi fundamental tidak bergantung pada jumlah dimensi n tertentu, dan tidak mengharuskan kita untuk menampilkan koordinat dari vektor mana pun. Ini adalah contoh yang baik dari efektifitas penggunaan metode ruang vektor. Akhirnya, perlu dicatat bahwa asumsi yang digunakan adalah cukup untuk menyimpulkan keterbalikan, tetapi tidak mendesak (tidak perlu). Artinya, ada kasus-kasus di mana pemetaan tersebut mungkin dapat dibalik, bahkan secara global, namun beberapa asumsi kita mungkin tidak valid (misalnya, f'(a) mungkin gagal untuk dapat dibalik).
5. Teorema Fungsi Implisit
A. Dari Linear ke Nonlinear
Jika kita punya 3 persamaan linear dengan 5 variabel (x₁, x₂, x₃, x₄, x₅), kita bisa menyatakan 3 variabel (misal x₃, x₄, x₅) sebagai fungsi dari 2 variabel sisanya (x₁, x₂), asalkan determinan dari koefisien variabel-variabel tersebut tidak sama dengan nol (det ≠ 0).Teorema Fungsi Implisit memperluas konsep ini ke fungsi nonlinear f(x, y) = 0. Karena fungsi nonlinear sulit diselesaikan secara langsung, kita menggunakan pendekatan linear (turunan) di satu titik spesifik. Syarat "determinan tidak nol" pada kasus linear berubah menjadi "determinan matriks Jacobian terhadap variabel terikat tidak nol" pada kasus nonlinear.
B. Sifat Lokal
Misal diberikan persamaan lingkaran:
f(x, y) = x² + y² – 1 = 0
Jika kita ingin mencari y sebagai fungsi dari x secara global, kita akan menemui masalah karena y = ±√(1 – x²). Untuk satu nilai x (misalkan x = 0), ada dua nilai y yaitu 1 dan –1. Ini melanggar syarat fungsi (satu input harus menghasilkan satu output). Namun, Teorema Fungsi Implisit bekerja secara lokal. Jika kita membatasi pandangan kita hanya pada "lingkungan kecil" di sekitar titik (0, 1), kurva lingkaran di titik tersebut bertingkah seperti fungsi tunggal yang valid, yaitu y = √(1 – x²). Itulah mengapa teorema ini selalu menekankan frasa "near (a, b)" (di dekat titik (a, b)).
C. Teorema Fungsi Implisit
Misalkan W adalah subset terbuka dari ℝp+q (yang akan kita identifikasikan dengan ℝᵖ × ℝq) dan misalkan f adalah fungsi yang terdiferensialkan secara kontinu dari W ke ℝq. Asumsikan lebih lanjut bahwa terdapat suatu titik (a, b) di dalam W sedemikian rupa sehingga f(a, b) = 0, dan sedemikian rupa sehingga turunan dari f(a, y) sebagai fungsi dari y adalah nonsingular di y = b. Maka persamaan f(x, y) = 0 menentukan y secara unik sebagai fungsi yang terdiferensialkan secara kontinu dari x di dekat (a, b).
Lebih tepatnya, terdapat suatu lingkungan E dari b di dalam ℝq, suatu lingkungan S dari a di dalam ℝᵖ, dan sebuah fungsi yang terdiferensialkan secara kontinu φ dari S ke ℝq sedemikian rupa sehingga φ(x) ∈ E dan f(x, φ(x)) = 0 kapan pun x berada di dalam S. Terlebih lagi, satu-satunya titik y dari E yang memenuhi f(x, y) = 0 untuk suatu x di dalam S adalah titik-titik di mana y = φ(x).
D. Penjelasan Teorema Fungsi Implisit
Jika kita memiliki sistem persamaan implisit f(x, y) = 0, teorema ini menjamin kita bisa menuliskan y sebagai fungsi dari x (ditulis y = φ(x) di sekitar titik (a, b), dengan dua syarat utama:
1. Titik tersebut memenuhi persamaan, yaitu f(a, b) = 0.
2. Turunan parsial fungsi terhadap variabel terikat (y) di titik tersebut memiliki matriks yang nonsingular (determinannya tidak nol, atau memiliki invers).
Jika kedua syarat ini terpenuhi, maka:
1. Fungsi y = φ(x) dipastikan ada secara unik di sekitar titik tersebut.
2. Fungsi φ(x) tersebut juga dapat diturunkan (differentiable).
6. Penurunan Perkalian Skalar (Dot Product) dari Fungsi Bernilai Vektor dengan Variabel Vektor
Kita ingat kembali dari kalkulus dasar bahwa jika dua fungsi riil dari satu variabel riil dapat diturunkan (diferensialkan), hasil kali dari fungsi-fungsi tersebut juga dapat diturunkan, dan rumus untuk turunan dari hasil kali tersebut adalah
(fg)'(x) = f(x)g'(x) + f'(x)g(x).
Rumus ini memiliki padanan untuk kasus perkalian titik (disebut juga perkalian skalar atau perkalian dalam) dari f(x) dan g(x) di mana f dan g adalah fungsi dari ℝⁿ ke ℝᵐ. Ingat kembali definisi perkalian titik di ℝⁿ.
A. Diferensial Perkalian Skalar Fungsi Bernilai Vektor
Misalkan f dan g adalah fungsi dari himpunan bagian terbuka dari ℝⁿ ke ℝᵐ, dan definisikan ϕ dari ℝⁿ ke ℝ melalui
ϕ(x) = f(x) · g(x).
Jika f dan g masing-masing dapat diturunkan pada x tertentu, maka begitu pula ϕ, dan
dϕ(x, h) = ϕ'(x) · h = f(x) · g'(x)h + f'(x)h · g(x),
untuk setiap vektor h di ℝⁿ.
B. Dalam Derivatif
Untuk tujuan aplikasi, sangat menguntungkan untuk menerjemahkan dari bahasa diferensial ke bahasa derivatif. Reformulasi ini dapat dipecah menjadi beberapa langkah kecil. Karena perkalian titik pada vektor bersifat komutatif, kita dapat menulis
ϕ'(x) · h = f(x) · g'(x)h + g(x) · f'(x)h,
dan menyatakan perkalian titik dalam bentuk perkalian matriks menghasilkan
ϕ'(x) · h = [f(x)]ᵀ [g'(x)h] + [g(x)]ᵀ [f'(x)h].
Menggunakan fakta bahwa perkalian matriks bersifat asosiatif,
ϕ'(x) · h = {[f(x)]ᵀ g'(x)}h + {[g(x)]ᵀ f'(x)}h = [f(x)]ᵀ g'(x) + g(x)ᵀ f'(x)]h.
Ingat kembali bahwa transpos dari jumlah dua matriks adalah jumlah dari transpos-transposnya, dan bahwa transpos dari suatu hasil kali adalah hasil kali dari transpos-transpos tersebut dengan urutan terbalik. Menggunakan kedua fakta ini kita mendapatkan
ϕ'(x) · h = [g'(x)ᵀ f(x) + f'(x)ᵀ g(x)]ᵀ h,
dan ini dapat ditulis sebagai perkalian titik dari vektor di dalam tanda kurung dengan h, yaitu,
dϕ(x, h) = ϕ'(x) · h = [g'(x)ᵀ f(x) + f'(x)ᵀ g(x)] · h.
Kita melihat bahwa satu-satunya cara agar hal ini berlaku untuk semua h adalah jika vektor di dalam tanda kurung merupakan gradien dari ϕ pada x. Oleh karena itu
ϕ'(x) = grad ϕ(x) = g'(x)ᵀ f(x) + f'(x)ᵀ g(x),
dan kita telah sampai pada reformulasi berikut:
Misalkan f dan g adalah fungsi dari himpunan bagian terbuka dari ℝⁿ ke ℝᵐ, dan definisikan ϕ dari ℝⁿ ke ℝ melalui
ϕ(x) = f(x) · g(x).
Jika f dan g masing-masing dapat diturunkan pada x tertentu, maka begitu pula ϕ, dan
ϕ'(x) = g'(x)ᵀ f(x) + f'(x)ᵀ g(x).
Perhatikan bahwa ketika f = g, rumus ini disederhanakan menjadi
ϕ'(x) = 2f'(x)ᵀ f(x).
C. Ringkasan
Jika f dan g terdiferensialkan di x, maka fungsi skalar ϕ juga terdiferensialkan. Bentuk diferensial dan turunannya dapat dinyatakan dalam beberapa representasi:
• Bentuk Diferensial:
dϕ(x, h) = ϕ'(x) · h = f(x) · g'(x)h + f'(x)h · g(x)
Untuk setiap vektor h di ℝⁿ.
• Bentuk Notasi Matriks / Transpose:
Jika dinyatakan dalam operasi matriks (di mana f'(x) dan g'(x) adalah matriks Jacobi), formulasi turunannya menjadi:
ϕ'(x) = grad ϕ(x) = g'(x)ᵀ f(x) + f'(x)ᵀ g(x)
• Kasus Khusus f = g:
Jika fungsi dikalikan dengan dirinya sendiri, rumus di atas menyusut menjadi:
ϕ'(x) = 2f'(x)ᵀ f(x).
D. Solusi Kuadrat Terkecil (Least Squares)
Misalkan terdapat sistem m persamaan linear dengan n variabel tidak diketahui yang dituliskan sebagai:
Ax = b (di mana A adalah matriks m × n)
Ketika sistem ini tidak memiliki solusi eksak (Ax – b ≠ 0), kita mencari solusi pendekatan yang membuat residual ‖Ax – b‖ sekecil mungkin. Ini setara dengan meminimalkan fungsi kuadrat:
ϕ(x) = ‖Ax – b‖² = (Ax – b) · (Ax – b)
Menemukan Titik Kritis:
Dengan memisalkan f(x) = Ax – b (sehingga f'(x) = A), dan menerapkan aturan turunan di atas, kita mencari grad ϕ(x) = 0:
ϕ'(x) = 2Aᵀ(Ax – b) = 0
AᵀAx = Aᵀb (Persamaan Normal)
Jika Matriks AᵀA (berukuran n × n) memiliki invers, maka diperoleh solusi kuadrat terkecil yang unik:
x = (AᵀA)⁻¹Aᵀb
Catatan Matriks Hessian: > Untuk memastikan titik kritis ini adalah nilai minimum mutlak, digunakan matriks Hessian dari ϕ, yaitu H = 2AᵀA. Karena bentuk kuadratik hᵀHh = 2‖Ah‖² ≥ 0, matriks Hessian ini bersifat definit positif (jika AᵀA nonsingular), yang membuktikan bahwa x tersebut memberikan nilai minimum global. Matriks (AᵀA)⁻¹Aᵀ disebut sebagai pseudoinvers dari A.
E. Nilai Ekstrem Bentuk Kuadratik
Misalkan A adalah matriks simetris n × n. Kita ingin mencari nilai ekstrem dari bentuk kuadratik x · Ax dengan kendala x berada pada bola satuan, yaitu ‖x‖² = x · x = 1.
Menggunakan metode Pengali Lagrange (Lagrange Multiplier), dibentuk fungsi baru:
ϕ(x) = x · Ax – λ(x · x) = x · (Ax – λx)
Mengambil turunan ϕ'(x) = 0 dengan aturan perkalian skalar, diperoleh:
ϕ'(x) = 2(Ax – λx) = 0
Ax = λx
Kesimpulan Teoretis:
• Vektor x yang meminimalkan atau memaksimalkan bentuk kuadratik tersebut haruslah merupakan vektor karakteristik (eigenvector) dari A.
• Skalar λ adalah nilai karakteristik (eigenvalue) yang bersesuaian.
• Nilai maksimum mutlak dari x · Ax pada bola satuan adalah nilai eigen terbesar dari A, dan nilai minimum mutlaknya adalah nilai eigen terkecil dari A.
F. Metode Penurunan Tercuram (Steepest Descent)
Metode ini digunakan untuk mencari solusi pendekatan dari sistem m persamaan non-linear dengan n variabel:
f⁽¹⁾(x₁, ..., xₙ) = 0, ..., f⁽ᵐ⁾(x₁, ..., xₙ) = 0 atau secara vektor f(x) = 0
Sama seperti prinsip kuadrat terkecil, kita ingin meminimalkan:
ϕ(x) = ‖f(x)‖² = f(x) · f(x)
Berdasarkan aturan turunan perkalian skalar, diperoleh gradiennya:
grad ‖f(x)‖² = 2[f'(x)]ᵀf(x) (di mana f'(x) adalah matriks Jacobian berukuran m × n)
Prosedur Iterasi:
Karena gradien [f'(x)]ᵀf(x) menunjukkan arah peningkatan fungsi yang paling tajam, maka untuk meminimalkan fungsi kita harus melangkah ke arah sebaliknya (negatif gradien). Dimulai dari tebakan awal x₀, kita menghasilkan barisan aproksimasi lewat skema rumus:
xₙ₊₁ = xₙ – αₙ[f'(x)]ᵀf(x)
Di mana αₙ adalah bilangan positif yang dipilih secara cermat (jika terlalu besar meleset, jika terlalu kecil konvergensinya lambat). Metode steepest descent ini cenderung lambat di dekat solusi akhir dibandingkan dengan Metode Newton, namun sangat baik digunakan sebagai strategi awal sebelum beralih ke Metode Newton saat posisi sudah dekat dengan solusi.
Komentar
Posting Komentar