自動(dòng)微分轉(zhuǎn)換系統(tǒng)及其應(yīng)用

時(shí)間：2024-01-31 11:32:26 程強(qiáng)1,2 王1由分享

摘要自動(dòng)微分轉(zhuǎn)換系統(tǒng)（DFT）由LASG和LSEC聯(lián)合研制開(kāi)發(fā)，目前已擁有成熟的版本。本文對(duì)DFT系統(tǒng)的功能、特色及其基本應(yīng)用作了全面的介紹，并給出了一些頗具說(shuō)服力的數(shù)值試驗(yàn)結(jié)果。同時(shí)，本文提出了統(tǒng)計(jì)準(zhǔn)確率評(píng)價(jià)的概念，這對(duì)評(píng)價(jià)一類(lèi)自動(dòng)微分工具及其微分模式代碼的可靠性與有效性提供了一種客觀的尺度。最后，本文還詳細(xì)討論了運(yùn)用切線性模式求解雅可比矩陣的問(wèn)題，給出了求解初始輸入矩陣的有效算法。

關(guān)鍵詞自動(dòng)微分切線性模式數(shù)據(jù)相關(guān)分析統(tǒng)計(jì)準(zhǔn)確率

1.引言

計(jì)算微分大致經(jīng)歷了從商微分，符號(hào)微分，手寫(xiě)代碼到自動(dòng)微分幾個(gè)階段。與其它幾種微分方法相比，自動(dòng)微分具有代碼簡(jiǎn)練、計(jì)算精度高及投入人力少等優(yōu)點(diǎn)。自動(dòng)微分實(shí)現(xiàn)的基本出發(fā)點(diǎn)是：一個(gè)數(shù)據(jù)相對(duì)獨(dú)立的程序?qū)ο螅Ｊ?、過(guò)程、程序段、數(shù)值語(yǔ)句乃至數(shù)值表達(dá)式），無(wú)論多么復(fù)雜，總可以分解為一系列有限數(shù)目的基本函數(shù)（如sin、exp、log）和基本運(yùn)算操作（加、減、乘、除、乘方）的有序復(fù)合；對(duì)所有這些基本函數(shù)及基本運(yùn)算操作，重復(fù)使用鏈?zhǔn)角髮?dǎo)法則，將得到的中間結(jié)果自上而下地做正向積分就可以建立起對(duì)應(yīng)的切線性模式，而自下而上地做反向積分就可以建立起對(duì)應(yīng)的伴隨模式[1]?；谧詣?dòng)微分方法得到的切線性模式和伴隨模式，在變分資料同化[2]、系統(tǒng)建模與參數(shù)辨識(shí)[3]、參數(shù)的敏感性分析 [4]、非線性最優(yōu)化以及數(shù)值模式的可預(yù)測(cè)性分析[5]等問(wèn)題中有著十分廣泛的應(yīng)用。
迄今為止，已有數(shù)十所大學(xué)和研究所各自開(kāi)發(fā)了能夠用于求解切線性模式的自動(dòng)微分系統(tǒng)，比較典型的有TAMC系統(tǒng)[6]、ADJIFOR系統(tǒng)[7] 和ODYSSEE系統(tǒng)[8]。在一些特定的運(yùn)用中，它們都是比較成功的，但在通用性和復(fù)雜問(wèn)題的處理效率上還存在許多不足。通常，自動(dòng)生成切線性模式的關(guān)鍵難題在于對(duì)象自身的強(qiáng)相關(guān)性，這給系統(tǒng)全局分析（如數(shù)據(jù)IO相關(guān)分析和數(shù)據(jù)依賴(lài)相關(guān)分析）和微分代碼的整體優(yōu)化都帶來(lái)了很多困難。同時(shí)，對(duì)于程序?qū)ο蟛豢蓪?dǎo)處的準(zhǔn)確識(shí)別和微分處理，至今仍還沒(méi)有一個(gè)統(tǒng)一而有效的算法。另外，最優(yōu)或有效求解稀疏雅可比矩陣一直是衡量一個(gè)自動(dòng)微分系統(tǒng)有效性的重要尺度。
統(tǒng)計(jì)準(zhǔn)確率被我們視為評(píng)價(jià)一類(lèi)自動(dòng)微分工具及其微分模式代碼可靠性與有效性的重要尺度。其基本假設(shè)是：如果對(duì)于定義域空間內(nèi)隨機(jī)抽樣獲得的至多有限個(gè)n維初始場(chǎng)（或網(wǎng)格點(diǎn)），微分模式輸出的差分和微分逼近是成功的；那么對(duì)于定義域空間內(nèi)所有可能初始場(chǎng)（或網(wǎng)格點(diǎn)），微分模式輸出的差分和微分逼近都是成功的。微分模式統(tǒng)計(jì)準(zhǔn)確率評(píng)價(jià)的具體方法是：在所有隨機(jī)抽樣得到的初始場(chǎng)（或網(wǎng)格點(diǎn)）附近，當(dāng)輸入擾動(dòng)逐漸趨向于機(jī)器有效精度所能表示的最小正值時(shí)，模式輸出的差分和微分之間應(yīng)該有足夠精度有效位數(shù)上的逼近。
DFT系統(tǒng)具有許多優(yōu)點(diǎn)，它能夠完全接受用FORTRAN 77語(yǔ)言編寫(xiě)的源代碼，微分代碼結(jié)構(gòu)清晰，其微分處理能力與問(wèn)題和對(duì)象的規(guī)模及復(fù)雜性無(wú)關(guān)。它基于YACC實(shí)現(xiàn)，具有很強(qiáng)的可擴(kuò)展性。DFT系統(tǒng)具有四個(gè)重要特色。它通過(guò)對(duì)象全局依賴(lài)相關(guān)分析，準(zhǔn)確求解雅可比矩陣的稀疏結(jié)構(gòu)，自動(dòng)計(jì)算有效初始輸入矩陣，從而可以用較小的代價(jià)求得整個(gè)雅可比矩陣。同時(shí)，它可以自動(dòng)生成客觀評(píng)價(jià)微分模式效率與可靠性的測(cè)試程序，對(duì)奇異函數(shù)做等價(jià)微分處理，并采用二元?dú)w約的方法，在語(yǔ)句級(jí)層次上實(shí)現(xiàn)微分代碼優(yōu)化。

2.系統(tǒng)概況
DFT系統(tǒng)主要由兩部分組成：微分代碼轉(zhuǎn)換和微分代碼評(píng)價(jià)，圖2.1。微分代碼轉(zhuǎn)換部分接受用戶(hù)輸入指令并自動(dòng)分析對(duì)象模式，生成切線性模式代碼及其相關(guān)測(cè)試代碼，后者直接構(gòu)成微分代碼評(píng)價(jià)系統(tǒng)的主體。微分代碼評(píng)價(jià)是DFT系統(tǒng)的一個(gè)重要特色。DFT系統(tǒng)的開(kāi)發(fā)小組認(rèn)為，一個(gè)微分模式如果在可靠性、時(shí)間和存儲(chǔ)效率上沒(méi)有得到充分的驗(yàn)證，至少對(duì)實(shí)際應(yīng)用而言，它將是毫無(wú)意義的。

原模式切線性模式

統(tǒng)計(jì)評(píng)價(jià)結(jié)果
圖2.1 DFT系統(tǒng)結(jié)構(gòu)簡(jiǎn)圖

2.1 微分代碼轉(zhuǎn)換

DFT系統(tǒng)是基于YACC在UNIX環(huán)境下開(kāi)發(fā)的，其結(jié)構(gòu)圖2.2所示。通過(guò)DFT系統(tǒng)產(chǎn)生的切線性模式代碼成對(duì)出現(xiàn)，并在語(yǔ)句級(jí)程度上做了簡(jiǎn)化，可讀性很強(qiáng)，如圖2.4。

切線性模式

評(píng)價(jià)函數(shù)集

圖2.2 微分代碼轉(zhuǎn)換
微分代碼轉(zhuǎn)換部分從功能上分為四個(gè)部分：詞法分析，語(yǔ)義分析，對(duì)象復(fù)雜性及數(shù)據(jù)相關(guān)分析和微分代碼轉(zhuǎn)換。對(duì)于一組具有復(fù)雜數(shù)據(jù)相關(guān)的程序模式對(duì)象，通常需要系統(tǒng)運(yùn)行兩遍才能得到有效而可靠的微分代碼。這主要有兩方面的考慮：其一，根據(jù)對(duì)象的復(fù)雜性（如最大語(yǔ)句長(zhǎng)度、最大變量維數(shù)、子過(guò)程或函數(shù)數(shù)目、子過(guò)程或函數(shù)內(nèi)最大變量數(shù)目等對(duì)象特征）選擇合適的系統(tǒng)參數(shù)以求最優(yōu)的運(yùn)行代價(jià)；其二，模式內(nèi)各子過(guò)程或函數(shù)之間以及一個(gè)子過(guò)程或函數(shù)內(nèi)往往具有很強(qiáng)的數(shù)據(jù)相關(guān)性，需要事先保存對(duì)象的相關(guān)信息并且在考慮當(dāng)前對(duì)象的屬性之前必須做上下文相關(guān)分析。

圖2.3 PERIGEE源程序代碼圖2.4 DFT系統(tǒng)生成的切線性代碼

2.2 微分代碼評(píng)價(jià)

通常，評(píng)價(jià)一個(gè)編譯系統(tǒng)的性能有很多方面，如處理速度、結(jié)果代碼可靠性及質(zhì)量、出錯(cuò)診斷、可擴(kuò)展和可維護(hù)性等。對(duì)于一類(lèi)自動(dòng)微分系統(tǒng)來(lái)說(shuō)，由于軟件開(kāi)發(fā)人力的局限以及對(duì)象模式的復(fù)雜多樣性,通過(guò)自動(dòng)轉(zhuǎn)換得到的微分模式并非常常是有效而可靠的（即無(wú)論是在數(shù)學(xué)意義上還是在程序邏輯上應(yīng)與期待的理想結(jié)果一致），因而在微分模式被投入實(shí)際應(yīng)用前，往往需要投入一定的人力來(lái)對(duì)其做嚴(yán)格的分析測(cè)試。
對(duì)切線性模式做統(tǒng)計(jì)評(píng)價(jià)測(cè)試的主要內(nèi)容可以簡(jiǎn)單敘述為：在網(wǎng)格化的模式定義域空間內(nèi)，選擇所有可能的網(wǎng)格點(diǎn)形成微分模式計(jì)算的初始場(chǎng)；在不同的網(wǎng)格點(diǎn)附近，隨機(jī)選取至少個(gè)線性無(wú)關(guān)的初始擾動(dòng)，對(duì)每個(gè)擾動(dòng)輸入分別進(jìn)行網(wǎng)格點(diǎn)逼近，統(tǒng)計(jì)考察模式輸出差分和微分在有效位數(shù)上的逼近程度。圖2.5描述了整個(gè)測(cè)試過(guò)程，它包含網(wǎng)格點(diǎn)數(shù)據(jù)隨機(jī)采樣（1）和網(wǎng)格點(diǎn)數(shù)據(jù)逼近（2）兩級(jí)循環(huán)。

圖2.5 切線性模式代碼的測(cè)試過(guò)程

3.系統(tǒng)主要特色

DFT系統(tǒng)并不是一個(gè)完整的FORTRAN編譯器，但它幾乎可以接受和處理所有FORTRAN 77編寫(xiě)的源模式代碼，并且可以很方便地?cái)U(kuò)展并接受FORTRAN 90編寫(xiě)的源模式代碼。本節(jié)將著重介紹DFT系統(tǒng)（版本3.0）的以下幾個(gè)重要特色。

3.1 結(jié)構(gòu)化的微分實(shí)現(xiàn)

DFT系統(tǒng)采用標(biāo)準(zhǔn)化的代碼實(shí)現(xiàn)，切線性模式的擾動(dòng)變量和基態(tài)值變量、微分計(jì)算語(yǔ)句和基態(tài)值計(jì)算語(yǔ)句總是成對(duì)出現(xiàn)，并具有清晰的程序結(jié)構(gòu)。微分代碼保持了原模式本身的結(jié)構(gòu)和風(fēng)格（如并行和向量特性、數(shù)據(jù)精度等），即語(yǔ)句到語(yǔ)句、結(jié)構(gòu)到結(jié)構(gòu)的微分實(shí)現(xiàn)。在奇異點(diǎn)或不可導(dǎo)處，DFT系統(tǒng)對(duì)微分?jǐn)_動(dòng)采取簡(jiǎn)單的清零處理，實(shí)踐證明這對(duì)抑制擾動(dòng)計(jì)算溢出具有重要意義，但并不影響評(píng)價(jià)測(cè)試結(jié)果。

3.2 全局?jǐn)?shù)據(jù)相關(guān)分析

DFT系統(tǒng)具有較強(qiáng)的數(shù)據(jù)相關(guān)分析能力，它包括全局?jǐn)?shù)據(jù)IO相關(guān)分析、全局?jǐn)?shù)據(jù)依賴(lài)相關(guān)分析、全局過(guò)程相關(guān)分析以及數(shù)據(jù)迭代相關(guān)分析幾個(gè)不同方面。數(shù)據(jù)依賴(lài)相關(guān)與數(shù)據(jù)IO相關(guān)關(guān)系密切，但又存在根本不同。前者強(qiáng)調(diào)每個(gè)變量在數(shù)學(xué)關(guān)系上的依賴(lài)性；而后者描述了一個(gè)對(duì)象的輸入輸出特性，且具有相對(duì)性，即任何一個(gè)變量參數(shù)，無(wú)論它是獨(dú)立變量還是依賴(lài)變量，在數(shù)學(xué)意義上都可等價(jià)為一個(gè)既是輸入又是輸出的參數(shù)來(lái)處理。
DFT系統(tǒng)記錄所有過(guò)程參數(shù)的IO屬性表，通過(guò)深度遞歸相關(guān)計(jì)算，準(zhǔn)確計(jì)算每個(gè)過(guò)程參數(shù)的最終IO屬性。DFT系統(tǒng)通過(guò)對(duì)數(shù)據(jù)相關(guān)矩陣做模二和及自乘迭代計(jì)算（An+1= An⊕An2）來(lái)完成數(shù)據(jù)的依賴(lài)相關(guān)分析，這種算法具有很好的對(duì)數(shù)收斂特性。DFT系統(tǒng)通過(guò)全局過(guò)程相關(guān)分析的結(jié)果，自動(dòng)生成模式的局部或整體相關(guān)引用樹(shù)結(jié)構(gòu)（如圖3.1），這對(duì)用戶(hù)分析復(fù)雜數(shù)值模式和微分評(píng)價(jià)測(cè)試都具有很好的指導(dǎo)作用。DFT系統(tǒng)還具有分析局部數(shù)據(jù)迭代相關(guān)和函數(shù)迭代相關(guān)的能力，這兩種形式的數(shù)據(jù)迭代相關(guān)是自動(dòng)微分實(shí)現(xiàn)頗具挑戰(zhàn)的難題之一。

圖3.1 GPS Rayshooting模式的相關(guān)樹(shù)結(jié)構(gòu)片段

3.3 自動(dòng)生成測(cè)試程序

基于IO相關(guān)分析的結(jié)果，DFT系統(tǒng)自動(dòng)生成微分測(cè)試代碼，分別對(duì)切線性模式的可靠性和運(yùn)行代價(jià)做統(tǒng)計(jì)評(píng)價(jià)測(cè)試。特別地，DFT系統(tǒng)還可將任何模式參數(shù)都視為輸入輸出參數(shù)，生成在數(shù)學(xué)意義上等價(jià)的測(cè)試代碼，這樣處理的不利之處在于往往需要極高的存儲(chǔ)開(kāi)銷(xiāo)。

3.4 基于語(yǔ)句級(jí)的代碼優(yōu)化

目前，DFT系統(tǒng)僅僅具備局地優(yōu)化能力。在語(yǔ)句級(jí)微分實(shí)現(xiàn)上采用二元?dú)w約的方法對(duì)微分代碼進(jìn)行優(yōu)化是DFT系統(tǒng)的一個(gè)重要特色。根據(jù)右端表達(dá)式的乘法復(fù)雜性及含變?cè)獢?shù)目的不同，DFT系統(tǒng)采取不同的分解策略。二元?dú)w約的方法避免了微分計(jì)算中的許多冗余計(jì)算，在一些復(fù)雜的非線性表達(dá)式的微分計(jì)算中具有最小的計(jì)算代價(jià)，同時(shí)也非常適合于微分系統(tǒng)的軟件實(shí)現(xiàn)。同時(shí)，對(duì)于某些特殊的運(yùn)算操作（除法、乘方）和特殊函數(shù)（如sqrt、exp），DFT系統(tǒng)較好地利用了基態(tài)值計(jì)算得到的中間結(jié)果，避免了微分實(shí)現(xiàn)中的冗余計(jì)算。

4.系統(tǒng)應(yīng)用

運(yùn)用自動(dòng)微分工具得到的切線性模式，可以在無(wú)截?cái)嗾`差意義下求解函數(shù)的數(shù)值微分和導(dǎo)數(shù)、稀疏雅可比矩陣。同時(shí)這些結(jié)果在數(shù)值參數(shù)敏感性分析、非線性最優(yōu)化以及其它數(shù)值理論分析中有著非常重要的應(yīng)用。這里簡(jiǎn)單介紹切線性模式的幾個(gè)基本應(yīng)用。
4.1 符號(hào)導(dǎo)數(shù)和微分

如果輸入為數(shù)學(xué)關(guān)系式，DFT系統(tǒng)可以自動(dòng)生成對(duì)應(yīng)的微分表達(dá)式和梯度，而與數(shù)學(xué)關(guān)系式的復(fù)雜程度無(wú)關(guān)。例如我們輸入關(guān)系式：

，（1）

DFT系統(tǒng)將自動(dòng)生成其符號(hào)微分形式及其梯度形式分別為

，（2）

4.2 數(shù)值導(dǎo)數(shù)和微分

切線性模式最基本的應(yīng)用就是在一定擾動(dòng)輸入下求解輸出變量的擾動(dòng)（響應(yīng)）。表4.1給出了DFT系統(tǒng)在對(duì)IAP 9L模式、GPS Rayshooting模式和GPS Raytrace模式三個(gè)數(shù)值模式做切線性化的具體應(yīng)用中，一些不同計(jì)算粒度、不同引用深度和不同程序風(fēng)格的核心子過(guò)程，以及它們的切線性模式在SGI 2000上運(yùn)行的統(tǒng)計(jì)評(píng)價(jià)測(cè)試結(jié)果，其中切線性模式的可靠性指標(biāo)都準(zhǔn)確到六個(gè)有效數(shù)字以上，在運(yùn)行時(shí)間、存儲(chǔ)開(kāi)銷(xiāo)和代碼復(fù)雜性方面分別是原模式的兩倍左右，比較接近于理想的微分代價(jià)結(jié)果（1.5倍）。除了IAP 9L模式由于過(guò)于復(fù)雜僅做粗略統(tǒng)計(jì)外，其余模式都用非注釋語(yǔ)句行數(shù)來(lái)表示各自的代碼復(fù)雜性。

表4.1 DFT系統(tǒng)在三個(gè)數(shù)值模式中的統(tǒng)計(jì)評(píng)價(jià)測(cè)試結(jié)果

性能指標(biāo)
對(duì)象模式運(yùn)行時(shí)間（10-3秒）存儲(chǔ)開(kāi)銷(xiāo)（字節(jié)數(shù)）代碼復(fù)雜性
原模式切線性
模式
原模式切線性
模式
原模式切線性
模式

Xyz2g2.5306.1605524110485589
IntCIRA1.5602.750133426614165
Dabel0.0350.072601202749
LSS8.30017.50669133879143
RP42.4085.10360572102238
Vgrad10.1000.21218564368282454
RefGr43.0086.0071865414373083578
LL2JK0.6261.350262252442232
RayFind462.70
×103125.4
×103985618212111179

EPSIMP1.76011.50445589101327
Hlimits0.8301.8802425774842543774
Int3sL26.9051.2082002916394584690
MAKE
NCEP1340392072292514458504584
Curvcent0.0130.038527542754

DYFRM3.800
×1037.250
×1035000*9500*161279
PHYSIC2.750
×1035.385
×10330005000*1399*
(含注釋行)2826*
(含注釋行)
適當(dāng)設(shè)置輸入擾動(dòng)的初值，運(yùn)用切線性模式可以簡(jiǎn)單求解輸出變量對(duì)輸入的偏導(dǎo)數(shù)。例如，對(duì)于一個(gè)含有個(gè)輸入?yún)?shù)的實(shí)型函數(shù)

（3）

這里設(shè) ，。運(yùn)用DFT系統(tǒng)，可以得到對(duì)應(yīng)的切線性模式

（4）

其中，為切線性模式的擾動(dòng)輸入?yún)?shù)?？梢酝ㄟ^(guò)以下辦法來(lái)求得偏導(dǎo)數(shù)：

（5）

其中。如果對(duì)于某個(gè) 既是輸入?yún)?shù)又是輸出參數(shù)，可以類(lèi)似以下過(guò)程引用的辦法來(lái)處理。對(duì)于過(guò)程引用的情形，例如一個(gè)含有個(gè)輸入?yún)?shù)的子過(guò)程

（6）

其中，為輸入?yún)?shù)；，為輸出參數(shù)；，既為輸入?yún)?shù)又為輸出參數(shù)。運(yùn)用DFT系統(tǒng)，可以得到對(duì)應(yīng)的切線性模式為

（7）

其中，，，分別為切線性模式的微分?jǐn)_動(dòng)輸入、輸出和輸入輸出參數(shù)?？梢酝ㄟ^(guò)以下輸入擾動(dòng)設(shè)置并引用切線性模式（7）來(lái)求得偏導(dǎo)數(shù)：

a) 設(shè)置；（，）；（）可以同時(shí)求得（）和（），其中。

b) 設(shè)置（）；；（，）可以同時(shí)求得（）和（），其中。

4.3 稀疏雅可比矩陣

運(yùn)用上節(jié)討論的方法來(lái)求解稀疏雅可比矩陣,具有極高的計(jì)算代價(jià)。例如，一個(gè)含個(gè)獨(dú)立和個(gè)依賴(lài)參數(shù)的子過(guò)程，為求解整個(gè)雅可比矩陣就需要反復(fù)調(diào)用次切線性模式，當(dāng) 相當(dāng)大時(shí)，這對(duì)許多實(shí)際的數(shù)值計(jì)算問(wèn)題是不能接受的。事實(shí)上，如果雅可比矩陣的任意兩列（行）相互正交，那么可以通過(guò)適當(dāng)設(shè)置擾動(dòng)輸入值，這兩列（行）的元素就可以通過(guò)一次引用切線性模式（伴隨模式）完全得到。設(shè) 和分別為雅可比矩陣的行寬度和列寬度，即各行和各列非零元素?cái)?shù)目的最大值，顯然有，。這里介紹幾種常用的求解方法。
正向積分當(dāng) 時(shí)，通常采用切線性模式來(lái)計(jì)算雅可比矩陣。根據(jù)雅可比矩陣的稀疏結(jié)構(gòu)，適當(dāng)選擇右乘初始輸入矩陣，可以獲得接近的計(jì)算時(shí)間代價(jià)。DFT系統(tǒng)采用一種逐列（行）求解的方法，來(lái)有效求解右（左）乘初始輸入矩陣。其基本思路是：按照某種列次序考察雅可比矩陣的各列；考察當(dāng)前列中所有非零元素，并對(duì)這些非零元素所在行的行向量做類(lèi)似模二和累加運(yùn)算（即將非零元素視為邏輯“1”，零元素視為邏輯“0”），從而得到一個(gè)描述當(dāng)前列與各行存在“某種”相關(guān)的標(biāo)志向量（其元素都是“1”或“0”）；依據(jù)此標(biāo)志向量，就很容易得到一個(gè)與之正交的列初始向量，其中與當(dāng)前列序號(hào)對(duì)應(yīng)的元素設(shè)置為“1”，而與標(biāo)志向量中非零元素序號(hào)對(duì)應(yīng)的元素設(shè)置為“0”，與標(biāo)志向量中非零元素序號(hào)對(duì)應(yīng)的元素設(shè)置為“-1”，顯然，該列初始向量是唯一的，并且對(duì)應(yīng)著當(dāng)前右乘初始輸入矩陣的最后一列；逐一考察已求解得到的列初始向量，如果某列初始向量與當(dāng)前求解得到的列初始向量按下面定義的乘法（見(jiàn)過(guò)程4）正交，那么這兩列就可以合并，即將當(dāng)前列初始向量中非“-1”的元素按照對(duì)應(yīng)關(guān)系分別賦值給該初始向量，并從記錄中刪除當(dāng)前列初始向量；重復(fù)以上過(guò)程，繼續(xù)按照給定列次序考察雅可比矩陣的“下一列”。不難說(shuō)明，按照不同列次序求解得到的右乘初始輸入矩陣可能不同。其中逐列求解右乘初始輸入矩陣的過(guò)程可以簡(jiǎn)單敘述為：
1）將右乘初始輸入矩陣所有元素的初值均設(shè)置為，，。。
2）如果，轉(zhuǎn)6）。否則，如果雅可比矩陣的第列中的所有元素均為，，重復(fù)2）的判斷。否則轉(zhuǎn)3）。
3）計(jì)算標(biāo)志向量。令，做如下計(jì)算：
， ;
4）設(shè) 為的列向量。在上定義乘法，對(duì)任意的，我們有：a）；b)如果，必有和。然后，做如下計(jì)算：
, ;
， 6);
2);
5）令，并做如下計(jì)算：
， ;
令 , 。如果，轉(zhuǎn)6）；否則，重復(fù)2）的判斷。
6）對(duì) ，，如果，則。取的前列，這樣，我們就得到了一個(gè) 維右乘初始輸入矩陣。
這里需要說(shuō)明的是，運(yùn)用上面的方法求得的右乘初始輸入矩陣不僅與求解雅可比矩陣的列序有關(guān)，而且與過(guò)程4）中的合并順序也有關(guān)系。至于如何最優(yōu)求解右乘初始輸入矩陣，目前還很難討論清楚。但是，大量模擬試驗(yàn)結(jié)果表明，運(yùn)用上面自然次序求得的右乘初始輸入矩陣寬度已經(jīng)非常接近于其下界值。

反向積分當(dāng) 和時(shí)，通常采用伴隨模式來(lái)計(jì)算雅可比矩陣。根據(jù)雅可比矩陣的稀疏結(jié)構(gòu)，適當(dāng)選擇左乘初始輸入矩陣，可以獲得接近的計(jì)算時(shí)間代價(jià)。其中左乘初始輸入矩陣的求解過(guò)程完全可以按照上面的方法進(jìn)行，但是在處理前必須先將雅可比矩陣轉(zhuǎn)置，最后還需將得到的初始輸入矩陣轉(zhuǎn)置才能最終得到左乘初始輸入矩陣。同時(shí)，其行寬度也已經(jīng)非常接近于其下界值。

混合積分如果將切線性模式和伴隨模式相結(jié)合，往往可以避免梯度向量運(yùn)算中的諸多冗余計(jì)算。例如，ADJIFOR系統(tǒng)在求解雅可比矩陣時(shí)，在語(yǔ)句級(jí)微分實(shí)現(xiàn)中首先用伴隨方法求得所有偏導(dǎo)數(shù)，然后做梯度向量積分；其計(jì)算時(shí)間代價(jià)與和模式的語(yǔ)句數(shù)目有關(guān)，而其存儲(chǔ)代價(jià)為。具體討論可參考文獻(xiàn)[7]。

5．結(jié)論

切線性模式在無(wú)截?cái)嗾`差意義上計(jì)算函數(shù)的方向?qū)?shù)、梯度或雅可比矩陣，以及在模式的可預(yù)測(cè)性及參數(shù)敏感性分析、伴隨模式構(gòu)造等相關(guān)問(wèn)題中有著廣泛應(yīng)用。DFT系統(tǒng)主要用于求解FORTRAN 77語(yǔ)言編寫(xiě)的切線性模式，具有很強(qiáng)的全局?jǐn)?shù)據(jù)相關(guān)分析能力。此外，DFT系統(tǒng)還具有其它幾個(gè)重要特色，如結(jié)構(gòu)化的微分實(shí)現(xiàn)、自動(dòng)生成微分測(cè)試程序以及基于語(yǔ)句級(jí)的微分代碼優(yōu)化。本文簡(jiǎn)單給出了DFT系統(tǒng)在求解數(shù)值和符號(hào)導(dǎo)數(shù)和微分、稀疏雅可比矩陣中的應(yīng)用。為評(píng)價(jià)一類(lèi)自動(dòng)微分系統(tǒng)，本文初步提出了統(tǒng)計(jì)準(zhǔn)確率的概念。
參考文獻(xiàn)

[1] Andreas Griewank. On Automatic Differentiation. In M. Iri and K. Tanabe, editors, Mathematical Programming:
Recent Developments and Applications. Kluwer Academic Publishers, 1989

[2] Le Dimet, F. X and O. Talagrand, Variational algorithms for analysis and assimilation of meteorological
observations: theoretical aspects, Tellus, 1986, 38A, 97-110

[3] P.Werbos, Applications of advances in nonlinear sensitivity analysis, In systems Modeling
and Optimization, New York, 1982, Springer Verlag, 762-777

[4 ] Christian Bischof, Gordon Pusch, and Ralf Knoesel. "Sensitivity Analysis of the MM5 Weather Model using
Automatic Differentiation," Computers in Physics, 0:605-612, 1996

[5] Mu Mu, et al，The predictability problem of weather and climate prediction, Progress in Nature Science, accepted.

[6] Giering R. et al. Recipes for Adjoint Code Construction. ACM Trans. On Math. Software. 1998，24（4）：
437-474.

[7] C. Bischof, A. Carle, P. Khademi, and G. Pusch. "Automatic Differentiation: Obtaining Fast and Reliable
Derivatives--Fast" in Control Problems in Industry, edited by I. Lasiecka and B. Morton, pages 1-16,Birkhauser,
Boston, 1995. CRPC version.

Rostaining N. et al. Automatic Differentiation in Odyssee, Tellus, 1993，45A：558-568

国产成人v爽在线免播放观看,日韩欧美色,久久99国产精品久久99软件,亚洲综合色网站,国产欧美日韩中文久久,色99在线,亚洲伦理一区二区

自動(dòng)微分轉(zhuǎn)換系統(tǒng)及其應(yīng)用

相關(guān)文章

熱門(mén)文章