Modèle identifiable

Si nous abandonnons l`hypothèse de normalité et exigeons que x * ne soient pas normalement distribués, en conservant seulement la condition d`indépendance ε ⊥ η ⊥ x *, alors le modèle devient identifiable. [4] le problème pratique est qu`il est souvent difficile de calculer $ Sigma $ pour des modèles même légèrement compliqués. Cette expression est égale à zéro pour presque tous les x uniquement lorsque tous ses coefficients sont égaux à zéro, ce qui n`est possible que lorsque | Σ1 | = | σ2 | et μ1 = μ2. Étant donné que dans le paramètre d`échelle σ est limité à plus de zéro, nous concluons que le modèle est identifiable: ƒθ1 = ƒθ2 ⇔ θ1 = θ2. pour chaque ensemble mesurable A ⊆ S (ici 1 {…} est la fonction d`indicateur). Ainsi, avec un nombre infini d`observations, nous pourrons trouver la vraie distribution de probabilité P0 dans le modèle, et puisque la condition d`identifiabilité ci-dessus exige que la carte θ ↦ P θ {displaystyle Theta mapsto P_ {Theta}} soit inversible, nous serons également en mesure de trouver la valeur réelle du paramètre qui a généré la distribution donnée P0. Je sais qu`avec un modèle qui n`est pas identifiable, on peut dire que les données sont générées par plusieurs affectations différentes aux paramètres du modèle. Je sais que parfois il est possible de contraindre les paramètres de sorte que tous sont identifiables, comme dans l`exemple dans Cassella & Berger 2e éd, section 11,2. Soit dit en passant, si vous pouvez dire en regardant votre modèle qu`il n`est pas identifiable (parfois vous pouvez), alors il est fréquent d`introduire des contraintes supplémentaires sur elle pour le rendre identifiable (comme vous l`avez mentionné). Cela s`apparente à la reconnaissance que la fonction $f (y) = y ^ {2} $ n`est pas un-à-un pour $y $ en $ [-1, 1] $, mais il est un-à-un si nous restreignons $y $ à se situer à l`intérieur $ [0,1] $. Dans les modèles plus compliqués, les équations sont plus dures, mais l`idée est la même. Dans vous ne faites pas un problème de ML alors vous pouvez être en mesure d`obtenir un handle sur $ Sigma $ en simulant des données à partir du modèle et d`estimer les paramètres un grand nombre de fois et le calcul d`un échantillon de la matrice de covariance.

Dans les statistiques, l`identifiabilité est une propriété qu`un modèle doit satisfaire afin que l`inférence précise soit possible. Un modèle est identifiable s`il est théoriquement possible d`apprendre les vraies valeurs des paramètres sous-jacents de ce modèle après avoir obtenu un nombre infini d`observations à partir de celui-ci. Mathématiquement, cela équivaut à dire que les différentes valeurs des paramètres doivent générer des distributions de probabilité différentes des variables observables. Habituellement, le modèle n`est identifiable que sous certaines restrictions techniques, auquel cas l`ensemble de ces exigences est appelé les conditions d`identification. LET P = {P θ: θ) {displaystyle {mathcal {P}} = {P_{theta}: Theta in Theta }} être un modèle statistique où l`espace de paramètre Θ {displaystyle Theta} est soit de type fini, soit de dimension infinie. Nous disons que P {displaystyle {mathcal {P}}} est identifiable si le mappage θ ↦ P θ {displaystyle Theta mapsto P_ {Theta}} est un-à-un: [2] modélisation dynamique; identifiabilité calibrage du modèle; conception d`expérience optimale; identification des paramètres l`identifiabilité du modèle dans le sens de l`invertibilité de la carte θ ↦ P θ {displaystyle Theta mapsto P_ {Theta}} équivaut à pouvoir apprendre le paramètre True du modèle si le modèle peut être observé indéfiniment longtemps. En effet, si {XT} ⊆ S est la séquence d`observations du modèle, puis par la forte Loi de grand nombre, où (ε, η, x *) sont des variables aléatoires indépendantes normales avec zéro valeur attendue et des variances inconnues, et seules les variables (x, y) sont observées. Ensuite, ce modèle n`est pas identifiable [4], seul le produit βσ ² ∗ est (où σ ² ∗ est la variance de la régresseuse latente x *). C`est aussi un exemple de modèle identifiable: bien que la valeur exacte de β ne puisse pas être apprise, nous pouvons garantir qu`elle doit se situer quelque part dans l`intervalle (βyx, 1 ÷ par), où βyx est le coefficient dans la régression des ols de y sur x, et par est le coefficient dans la régresse des ols ion de x sur y.

[5] Si vous réussissez avec ce plan, alors votre modèle est identifiable; continuer avec votre entreprise.