Derivada covariante

El transporte paralelo de un vector a lo largo de una curva cerrada sobre la esfera, que al igual que el concepto de derivada covariante se basa en la noción de conexión matemática. El ángulo α {\displaystyle \alpha } después de recorrer una vez la curva es proporcional al área dentro de la curva.

La derivada covariante ( i {\displaystyle \scriptstyle \nabla _{i}} ) es una generalización del concepto de derivada parcial ( i {\displaystyle \scriptstyle \partial _{i}} ) que permite extender el cálculo diferencial sobre R n {\displaystyle \scriptstyle \mathbb {R} ^{n}} con coordenadas cartesianas al caso de coordenadas curvilíneas en R n {\displaystyle \scriptstyle \mathbb {R} ^{n}} (y también al caso todavía más general de variedades diferenciables).

El nombre está motivado por la importancia de los cambios de coordenadas en física: la derivada covariante transforma covariantemente bajo una transformación de coordenadas general, es decir, linealmente, a través de la matriz jacobiana de la transformación.[1]

Historia

Históricamente, a principios del siglo XX, Gregorio Ricci-Curbastro y Tullio Levi-Civita introdujeron la derivada covariante en la teoría de las geometrías riemanniana y pseudoriemanniana.[2]​ Ricci y Levi-Civita (siguiendo las ideas de Elwin Bruno Christoffel) observaron que los símbolos de Christoffel utilizados para definir la curvatura también podrían proporcionar una noción de diferencial que generalizara la idea de derivada direccional clásica de un campo vectorial sobre una variedad.[3][4]​ Esta nueva derivada, la Conexión de Levi-Civita, era covariante en el sentido de que satisfacía el requisito de Riemann de que los objetos en geometría debían ser independientes de su descripción en un sistema de coordenadas particular.

Pronto otros matemáticos, entre los que destacan Hermann Weyl, Jan Arnoldus Schouten y Élie Cartan,[5]​ se dieron cuenta de que una derivada covariante podía definirse de manera abstracta sin la presencia de una métrica. La característica crucial no fue una dependencia particular de la métrica, sino que los símbolos de Christoffel cumplían una cierta ley precisa de transformación de segundo orden. Esta ley de transformación podría servir como punto de partida para definir la derivada de forma covariante. Así, la teoría de la diferenciación covariante se separó del contexto estrictamente riemanniano para incluir una gama más amplia de geometrías posibles.

En la década de 1940, los investigadores dedicados al estudio de la geometría diferencial comenzaron a introducir otras nociones de diferenciación covariante en fibrados vectoriales generales que, a diferencia de los paquetes clásicos de interés para los geómetras, no formaban parte del campo tensorial de la variedad. En general, estas derivadas covariantes generalizadas tuvieron que ser especificadas "ad hoc" mediante alguna versión del concepto de conexión. En 1950, Jean-Louis Koszul unificó estas nuevas ideas de diferenciación covariante en un haz de vectores mediante lo que hoy se conoce como conexión de Koszul o una conexión en un haz de vectores.[6]​ Utilizando ideas del álgebra de Lie cohomológica, Koszul convirtió con éxito muchas de las características analíticas de la diferenciación covariante en características algebraicas. En particular, las conexiones de Koszul eliminaron la necesidad de manipulaciones incómodas de los símbolos de Christoffel (y de otros objetos análogos no tensoriales) en geometría diferencial. Así, rápidamente suplantaron a la noción clásica de derivada covariante en muchos tratamientos del tema posteriores a 1950.

Introducción

Se introducirá primero el caso de R n {\displaystyle \scriptstyle \mathbb {R} ^{n}} . Supóngase que se tienen n campos vectoriales que en cada punto forman una base vectorial { e 1 , e n } {\displaystyle \scriptstyle \{\mathbf {e} _{1},\dots \mathbf {e} _{n}\}} y un campo vectorial contravariante adicional v {\displaystyle \scriptstyle \mathbf {v} } de tal manera que este campo puede expresarse en términos de la base anterior:

v ( x ) = k = 1 n v k ( x ) e k ( x ) {\displaystyle \mathbf {v} (x)=\sum _{k=1}^{n}v^{k}(x)\mathbf {e} _{k}(x)}

Donde v k {\displaystyle \scriptstyle v^{k}} son las componentes del vector en dicha base. Si se usan coordenadas curvilíneas ( x 1 , x n ) {\displaystyle \scriptstyle (x^{1},\dots x^{n})} , los vectores tangentes a las curvas coordenadas cambian de punto a punto. Eso implica que aun cuando el campo vectorial sea constante en general sus coordenadas en la base elegida no serán constantes y en general sucederá que la derivada covariante ( ¯ {\displaystyle \scriptstyle {\bar {\partial }}} ):

¯ i v v x i := k = 1 n v k x i e k {\displaystyle {\bar {\partial }}_{i}\mathbf {v} \neq {\frac {\partial \mathbf {v} }{\partial x^{i}}}:=\sum _{k=1}^{n}{\frac {\partial v^{k}}{\partial x^{i}}}\mathbf {e} _{k}}

Ya que también es necesario considerar la variación de orientación de la base vectorial al pasar de un punto a otro, es decir, para evaluar la derivada (covariante) anterior necesitamos evaluar:

(1) ¯ i v = ¯ v ¯ x i := k = 1 n v k x i e k + k = 1 n v k ¯ e k ¯ x i {\displaystyle {\bar {\partial }}_{i}\mathbf {v} ={\frac {{\bar {\partial }}\mathbf {v} }{{\bar {\partial }}x^{i}}}:=\sum _{k=1}^{n}{\frac {\partial v^{k}}{\partial x^{i}}}\mathbf {e} _{k}+\sum _{k=1}^{n}v^{k}{\frac {{\bar {\partial }}\mathbf {e} _{k}}{{\bar {\partial }}x^{i}}}}

Donde el término segundo adicional da cuenta de cómo cambia la base vectorial al recorrer una línea coordenada curvilínea. Es decir cuando se usan coordenadas cartesianas en R n {\displaystyle \scriptstyle \mathbb {R} ^{n}} las líneas coordenadas son líneas rectas paralelas a los ejes coordenados, y de alguna manera en cada punto la base vectorial escogida para medir las coordenadas de un campo vectorial en todos los puntos están "sincronizadas". Pero en coordenadas curvilíneas al pasar de un punto a otro, los vectores tangentes a las líneas coordenadas usados como base no coindirán de un punto a otro y es necesario computar su variación al cambiar de punto. En general los vectores e k ( x ) {\displaystyle \scriptstyle \mathbf {e} _{k}(x)} no sólo dependen del punto, es necesario especificar cómo se "conectan" los vectores en diferentes puntos y para ello se define una conexión que en el caso de R n {\displaystyle \scriptstyle \mathbb {R} ^{n}} puede representarse como un conjunto de coeficientes:

(2) ¯ e k ¯ x i := m = 1 n Γ k i m e m {\displaystyle {\frac {{\bar {\partial }}\mathbf {e} _{k}}{{\bar {\partial }}x^{i}}}:=\sum _{m=1}^{n}\Gamma _{ki}^{m}\mathbf {e} _{m}}

Los coeficientes Γ j i k {\displaystyle \scriptstyle \Gamma _{ji}^{k}} se llaman símbolos de Christoffel y definen localmente la conexión. Juntanto los resultados de (1) y (2) la derivada covariante parcial de un campo vectorial puede expresarse mediante:

(3a) i v = ¯ v ¯ x i = k = 1 n v k x i e k + k = 1 n m = 1 n v k Γ k i m e m {\displaystyle \nabla _{i}\mathbf {v} ={\frac {{\bar {\partial }}\mathbf {v} }{{\bar {\partial }}x^{i}}}=\sum _{k=1}^{n}{\frac {\partial v^{k}}{\partial x^{i}}}\mathbf {e} _{k}+\sum _{k=1}^{n}\sum _{m=1}^{n}v^{k}\Gamma _{ki}^{m}\mathbf {e} _{m}}

Usando el convenio de sumación de Einstein y renombrando los índices la expresión anterior puede escribirse simplemente como:

(3b) i v = ( d v k d x i + Γ m i k v m ) e k {\displaystyle \nabla _{i}\mathbf {v} =\left({\frac {dv^{k}}{dx^{i}}}+\Gamma _{mi}^{k}v^{m}\right)\mathbf {e} _{k}}

La expresión entre paréntesis representa las componentes de la derivada covariante del vector contravariante v {\displaystyle \scriptstyle \mathbf {v} } . Análogamente dada una curva t ( x 1 ( t ) , , x n ( t ) ) {\displaystyle \scriptstyle t\mapsto (x^{1}(t),\dots ,x^{n}(t))} se define la derivada covariante temporal a lo largo de dicha curva como:

D v D t = x ˙ i i v = ( d v k d x i + Γ m i k v m ) d x i d t e k {\displaystyle {\frac {D\mathbf {v} }{Dt}}={\dot {x}}^{i}\nabla _{i}\mathbf {v} =\left({\frac {dv^{k}}{dx^{i}}}+\Gamma _{mi}^{k}v^{m}\right){\frac {dx^{i}}{dt}}\mathbf {e} _{k}}

Caso euclídeo

La necesidad de la generalización de la derivada ordinaria en R n {\displaystyle \scriptstyle \mathbb {R} ^{n}} se aprecia cuando su usan coordandas curvilíneas como se ha dicho. Basta el movimiento de una partícula expresado en coordenadas cartesianas y luego el mismo movimiento expresado en coordenadas polares, por ejemplo, consideremos una masa puntual que se mueve a lo largo de la trayectoria recta por:

{ x ( t ) = d cos θ 0 v t sen θ 0 y ( t ) = d sen θ 0 + v t cos θ 0 y ( t ) = d x cos ( θ 0 ) sen θ 0 {\displaystyle {\begin{cases}x(t)=d\cos \theta _{0}-vt\operatorname {sen} \theta _{0}\\y(t)=d\operatorname {sen} \theta _{0}+vt\cos \theta _{0}\end{cases}}\Rightarrow \qquad \qquad y(t)={\frac {d-x\cos(\theta _{0})}{\operatorname {sen} \theta _{0}}}}

Es decir, el punto se mueve con una velocidad v {\displaystyle \scriptstyle v} uniforme a lo largo de una recta, esto puede verse de manera sencilla, si se calculan las velocidades y las aceleraciones de la partícula:

{ v x = d x d t = v sen θ 0 v y = d y d t = + v cos θ 0 , { a x = d v x d t = 0 a y = d v y d t = 0 {\displaystyle {\begin{cases}v^{x}={\cfrac {dx}{dt}}=-v\operatorname {sen} \theta _{0}\\v^{y}={\cfrac {dy}{dt}}=+v\cos \theta _{0}\end{cases}},\qquad \qquad {\begin{cases}a^{x}={\cfrac {dv^{x}}{dt}}=0\\a^{y}={\cfrac {dv^{y}}{dt}}=0\end{cases}}}

Donde se ha usado la notación x ˙ = d x / d t {\displaystyle \scriptstyle {\dot {x}}=dx/dt} y y ˙ = d y / d t {\displaystyle \scriptstyle {\dot {y}}=dy/dt} .

Ahora consideramos el cálculo de la aceleración en coordenadas polares. Como la partícula se mueve sobre una recta la distancia al origen y el ángulo polar estarán relacionados mediante la relación:

{ ρ ( t ) = d 2 + v 2 t 2 θ ( t ) = θ 0 + arctan ( v t d ) ρ ( t ) = d cos ( θ ( t ) θ 0 ) ,   ( θ 0 π / 2 < θ < θ 0 + π / 2 ) {\displaystyle {\begin{cases}\rho (t)={\sqrt {d^{2}+v^{2}t^{2}}}\\\theta (t)=\theta _{0}+\arctan \left({\cfrac {vt}{d}}\right)\end{cases}}\Rightarrow \qquad \qquad \rho (t)={\frac {d}{\cos(\theta (t)-\theta _{0})}},\ (\theta _{0}-\pi /2<\theta <\theta _{0}+\pi /2)}

Las coordenadas de la velocidad de la partícula en estas coordenadas pueden determinarse mediante cálculo directo o cambiando de base a partir de la componentes cartesianas:

v ρ = ρ ˙ = v sen ( θ θ 0 ) , v θ = θ ˙ = v ρ cos ( θ θ 0 ) {\displaystyle v^{\rho }={\dot {\rho }}=v\operatorname {sen}(\theta -\theta _{0}),\qquad \qquad v^{\theta }={\dot {\theta }}={\frac {v}{\rho }}\cos(\theta -\theta _{0})}

Puesto que la partícula se mueve a velocidad constante el vector aceleración debería resultar nulo. De acuerdo a lo discutido anteriormente, las componentes del vector aceleración pueden obtenerse mediante las coordenadas covariantes:

{ a ρ = D v ρ D t = ρ ˙ ( v ρ ρ + Γ ρ ρ ρ v ρ + Γ ρ θ ρ v θ ) + θ ˙ ( v ρ θ + Γ θ ρ ρ v ρ + Γ θ θ ρ v θ ) = = ρ ˙ ( 0 + 0 + 0 ) + θ ˙ ( v cos ( θ θ 0 ) + 0 ρ v ρ cos ( θ θ 0 ) ) = 0 a θ = D v θ D t = ρ ˙ ( v θ ρ + Γ ρ ρ θ v ρ + Γ ρ θ θ v θ ) + θ ˙ ( v θ θ + Γ θ ρ θ v ρ + Γ θ θ θ v θ ) = ρ ˙ ( v cos ( θ θ 0 ) ρ 2 + 0 + 1 ρ v cos ( θ θ 0 ) ρ ) + θ ˙ ( v sen ( θ θ 0 ) ρ + 1 ρ v sen ( θ θ 0 ) + 0 ) = 0 {\displaystyle {\begin{cases}a^{\rho }={\cfrac {Dv^{\rho }}{Dt}}={\dot {\rho }}\left({\cfrac {\partial v^{\rho }}{\partial \rho }}+\Gamma _{\rho \rho }^{\rho }v^{\rho }+\Gamma _{\rho \theta }^{\rho }v^{\theta }\right)+{\dot {\theta }}\left({\cfrac {\partial v^{\rho }}{\partial \theta }}+\Gamma _{\theta \rho }^{\rho }v^{\rho }+\Gamma _{\theta \theta }^{\rho }v^{\theta }\right)=\\={\dot {\rho }}(0+0+0)+{\dot {\theta }}\left(v\cos(\theta -\theta _{0})+0-\rho {\cfrac {v}{\rho }}\cos(\theta -\theta _{0})\right)=0\\a^{\theta }={\cfrac {Dv^{\theta }}{Dt}}={\dot {\rho }}\left({\cfrac {\partial v^{\theta }}{\partial \rho }}+\Gamma _{\rho \rho }^{\theta }v^{\rho }+\Gamma _{\rho \theta }^{\theta }v^{\theta }\right)+{\dot {\theta }}\left({\cfrac {\partial v^{\theta }}{\partial \theta }}+\Gamma _{\theta \rho }^{\theta }v^{\rho }+\Gamma _{\theta \theta }^{\theta }v^{\theta }\right)=\\{\dot {\rho }}\left(-{\cfrac {v\cos(\theta -\theta _{0})}{\rho ^{2}}}+0+{\cfrac {1}{\rho }}{\cfrac {v\cos(\theta -\theta _{0})}{\rho }}\right)+{\dot {\theta }}\left(-{\cfrac {v\operatorname {sen}(\theta -\theta _{0})}{\rho }}+{\cfrac {1}{\rho }}v\operatorname {sen}(\theta -\theta _{0})+0\right)=0\end{cases}}}

Es importante notar como en este caso las derivadas parciales ordinarias no coinciden con las componentes de la aceleración:

{ a ρ d v ρ d t = v ρ ρ ρ ˙ + v ρ θ θ ˙ a θ d v θ d t = v θ ρ ρ ˙ + v θ θ θ ˙ {\displaystyle {\begin{cases}a^{\rho }\neq {\cfrac {dv^{\rho }}{dt}}={\cfrac {\partial v^{\rho }}{\partial \rho }}{\dot {\rho }}+{\cfrac {\partial v^{\rho }}{\partial \theta }}{\dot {\theta }}\\a^{\theta }\neq {\cfrac {dv^{\theta }}{dt}}={\cfrac {\partial v^{\theta }}{\partial \rho }}{\dot {\rho }}+{\cfrac {\partial v^{\theta }}{\partial \theta }}{\dot {\theta }}\end{cases}}}

Ya que en coordenadas polares los vectores de la base varían de punto a punto, y es por ello que sólo usando la derivada covariante se obtiene un vector de aceleración nulo tal como cabía esperar a partir del cálculo en coordenadas cartesianas.

Caso general

En una variedad diferenciable o una hipersuperficie de R n {\displaystyle \scriptstyle \mathbb {R} ^{n}} , por otra parte, el concepto de derivada direccional se define a partir del espacio tangente a cada punto. En el caso general al presentar la variedad o la hipersuperficie curvatura, los espacios tangentes de cada punto difiere del de los puntos cercanos y por tanto se necesita alguna manera de "conectar" o identificar vectores de diferentes espacios vectoriales, mediante una conexión sobre la variedad.

En una variedad riemanniana comúnmente se escoge una conexión (sin torsion) que sea compatible con la métrica, expresada por las componentes del tensor métrico g μ ν {\displaystyle \scriptstyle g_{\mu \nu }} , en el sentido de que:

α g μ ν = 0 Γ μ ν ρ = g ρ σ 2 ( g σ ν x μ + g μ σ x ν g μ ν x σ ) {\displaystyle \nabla _{\alpha }g_{\mu \nu }=0\Rightarrow \Gamma _{\mu \nu }^{\rho }={\frac {g^{\rho \sigma }}{2}}\left({\frac {\partial g_{\sigma \nu }}{\partial x^{\mu }}}+{\frac {\partial g_{\mu \sigma }}{\partial x^{\nu }}}-{\frac {\partial g_{\mu \nu }}{\partial x^{\sigma }}}\right)}

Derivada covariante de un tensor

En las secciones anteriores la discusión de la derivada covariante se ha limitado a un campo vectorial contravariante. Pero la derivada covariante puede extenderse a otros tipos de campos tensoriales definidos sobre una variedad de Riemann. Para extender la definición usa el hecho de que la derivada parcial de un escalar coincide con la derivada covariante parcial de dicho escalar, es decir:

β φ := β φ {\displaystyle \nabla _{\beta }\varphi :=\partial _{\beta }\varphi \,}

Así para calcular la derivada covariante parcial de una 1-forma θ = θ α d x α {\displaystyle \scriptstyle {\boldsymbol {\theta }}=\theta _{\alpha }dx^{\alpha }} se considera su contracción con un campo vectorial contravariante y teniendo en cuenta que la derivada covariante en una derivación para la cual vale la regla del producto:

β ( θ α v α ) = β ( θ α v α ) = ( β θ α ) v α + θ α ( β v α ) {\displaystyle \partial _{\beta }(\theta _{\alpha }v^{\alpha })=\nabla _{\beta }(\theta _{\alpha }v^{\alpha })=(\nabla _{\beta }\theta _{\alpha })v^{\alpha }+\theta _{\alpha }(\nabla _{\beta }v^{\alpha })}

Esto lleva a la siguiente relación entre componentes:

β θ α = d θ α d x β Γ α β μ θ μ {\displaystyle \nabla _{\beta }\theta _{\alpha }={\frac {d\theta _{\alpha }}{dx^{\beta }}}-\Gamma _{\alpha \beta }^{\mu }\theta _{\mu }}

Para un tensor de tipo (p,q) general se tendrá:

α T δ 1 δ m β 1 β n = T δ 1 δ m β 1 β n x α + i Γ α ρ β i T δ 1 δ m β 1 ρ β n i Γ α δ i ρ T δ 1 ρ δ m β 1 β n {\displaystyle \nabla _{\alpha }T_{\delta _{1}\dots \delta _{m}}^{\beta _{1}\dots \beta _{n}}={\frac {\partial T_{\delta _{1}\dots \delta _{m}}^{\beta _{1}\dots \beta _{n}}}{\partial x^{\alpha }}}+\sum _{i}\Gamma _{\alpha \rho }^{\beta _{i}}T_{\delta _{1}\dots \delta _{m}}^{\beta _{1}\dots \rho \dots \beta _{n}}-\sum _{i}\Gamma _{\alpha \delta _{i}}^{\rho }T_{\delta _{1}\dots \rho \dots \delta _{m}}^{\beta _{1}\dots \beta _{n}}}

Propiedades

En lo anterior se ha considerado la noción de derivada covariante de manera naturalista extendiendo a coordenadas curvilíneas la noción de derivada parcial, ese enfoque conduce a un operador de derivación covariante con las siguientes propiedades:

  1. Linealidad: Para todo A y B de T r s ( R n ) {\displaystyle {\mathcal {T}}_{r}^{s}(\mathbb {R} ^{n})} y cualesquiera α , β R {\displaystyle \alpha ,\beta \in \mathbb {R} } : μ ( α A β 1 β m α 1 α n + β B β 1 β m α 1 α n ) = α μ A β 1 β m α 1 α n + β μ B β 1 β m α 1 α n {\displaystyle \nabla _{\mu }(\alpha A_{\beta _{1}\dots \beta _{m}}^{\alpha _{1}\dots \alpha _{n}}+\beta B_{\beta _{1}\dots \beta _{m}}^{\alpha _{1}\dots \alpha _{n}})=\alpha \nabla _{\mu }A_{\beta _{1}\dots \beta _{m}}^{\alpha _{1}\dots \alpha _{n}}+\beta \nabla _{\mu }B_{\beta _{1}\dots \beta _{m}}^{\alpha _{1}\dots \alpha _{n}}}
  2. Regla de Leibniz:
  3. Comutatividad con la contracción:
  4. Consistencia con la noción de vector tangente:

Otra posibilidad es definir una derivada covariante más formalmente es construir un operador que satisfaga por construcción las propiedades anteriores

Véase también

Referencias

  1. Einstein, Albert (1922). «The General Theory of Relativity». The Meaning of Relativity. 
  2. Ricci, G.; Levi-Civita, T. (1901). «Méthodes de calcul différential absolu et leurs applications». Mathematische Annalen 54 (1–2): 125-201. S2CID 120009332. doi:10.1007/bf01454201. 
  3. Riemann, G. F. B. (1866). «Über die Hypothesen, welche der Geometrie zu Grunde liegen». Gesammelte Mathematische Werke. ; reprint, ed. Weber, H. (1953), New York: Dover.
  4. Christoffel, E. B. (1869). «Über die Transformation der homogenen Differentialausdrücke zweiten Grades». Journal für die reine und angewandte Mathematik 70: 46-70. 
  5. cf. with Cartan, É (1923). «Sur les variétés à connexion affine et la theorie de la relativité généralisée». Annales, École Normale 40: 325-412. doi:10.24033/asens.751. 
  6. Koszul, J. L. (1950). «Homologie et cohomologie des algebres de Lie». Bulletin de la Société Mathématique 78: 65-127. doi:10.24033/bsmf.1410. 

Bibliografía

  • Robert M. Wald, General Relativity, Chicago University Press, ISBN 0-226-87033-2.
Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q2287715
  • Wd Datos: Q2287715