Función convexa

Función convexaFunción convexa

En matemática, una función convexa una función real es convexa en un intervalo (a,b), si la cuerda que une dos puntos cualesquiera en el grafo de la función queda por encima de la función.

Igualmente, si la función se define R n {\displaystyle \mathbb {R} ^{n}} (o sobre un dominio convexo), dicha función será convexa si la cuerda definida por los valores de la función en dos puntos cualesquiera de dicho dominio queda por encima de la n-superficie que constituye el grafo de la función.

Definición

Función convexa en un intervalo .

Una función real f definida en un intervalo (o en cualquier subconjunto convexo de algún espacio vectorial) se llama función convexa si está definida sobre un conjunto convexo C y para cualesquiera dos puntos x, y miembros de C, y para cada t en , se cumple que:

f ( t x + ( 1 − t ) y ) ≤ t f ( x ) + ( 1 − t ) f ( y ) . {\displaystyle f(tx+(1-t)y)\leq tf(x)+(1-t)f(y).}

En otras palabras, una función es convexa si y solo si su epigrafo (el conjunto de puntos situados en o sobre el grafo) es un conjunto convexo.

Una función estrictamente convexa es aquella en que

f ( t x + ( 1 − t ) y ) < t f ( x ) + ( 1 − t ) f ( y ) {\displaystyle f(tx+(1-t)y)<tf(x)+(1-t)f(y)\,}

para cualquier t en (0,1) y x ≠ y . {\displaystyle x\neq y.}

Una función f {\displaystyle f} es cóncava si la función − f {\displaystyle -f} es convexa.

Propiedades

Una función (en azul) es convexa si y solo si la región sobre su grafo (en verde) es un conjunto convexo.

Una función convexa f definida en un intervalo abierto C es continua en C y diferenciable en todos los puntos menos en un conjunto numerable. Si C es cerrado, entonces f puede no ser continua en los puntos críticos o finales de C.

Una función es punto-medio convexa (midpoint convex) en un intervalo "C" si

f ( x + y 2 ) ≤ f ( x ) + f ( y ) 2 {\displaystyle f\left({\frac {x+y}{2}}\right)\leq {\frac {f(x)+f(y)}{2}}}

para todo x e y en C. Esta condición es solo ligeramente más relajada que la de convexidad. En particular, una función continua que es punto-medio convexa será también convexa.

Una función diferenciable de una variable es convexa en un intervalo si y solo si su derivada es monótonamente no-decreciente en ese intervalo.

Una función continuamente diferenciable de una variable es convexa en un intervalo si y solo si la función se encuentra por encima de todas sus tangentes: f(y) ≥ f(x) + f '(x) (y − x) para todo x e y en el intervalo. En particular, si f '(c) = 0, luego c es un mínimo absoluto de f(x).

Una función doblemente diferenciable de una variable es convexa en un intervalo si y solo si su segunda derivada es no negativa en ese intervalo; esto proporciona una prueba práctica para verificar convexidad. Si la segunda derivada es positiva, entonces es estrictamente convexa, pero la doble implicación no se cumple, como podemos ver por ejemplo en f(x) = x4.

En general, una función continua doblemente diferenciable de muchas variables es convexa en un conjunto convexo si y solo si su matriz Hessiana es definida positiva en el interior de ese conjunto convexo.

Cualquier mínimo local de una función convexa es también un mínimo absoluto. Una función estrictamente convexa tendrá a lo más un mínimo absoluto.

Para una función convexa f, los conjuntos de nivel {x | f(x) < a} y {x | f(x) ≤ a} con a ∈ R son conjuntos convexos. Sin embargo, una función cuyos conjuntos de nivel son conjuntos convexos puede no resultar ser convexa; una función de este tipo se llama función cuasi-convexa.

La inecuación de Jensen se aplica a toda función convexa f. Si X {\displaystyle X} es una variable aleatoria que toma valores en el dominio de f, entonces E f ( X ) ≥ f ( E X ) . {\displaystyle Ef(X)\geq f(EX).} (Aquí E {\displaystyle E} denota la esperanza matemática.)

Cálculo de función convexa

Ejemplos

Teoremas sobre funciones convexas

El siguiente teorema generaliza un resultado bien conocido en R {\displaystyle \scriptstyle \mathbb {R} } a cualquier espacio normado sea de dimensión finita o infinita:

(Condición necesaria de mínimo local) Sea J : U → R {\displaystyle J:U\to \mathbb {R} } una función definida sobre un conjunto convexo U {\displaystyle U\,} de un espacio vectorial normado. Si el punto u ∈ U {\displaystyle u\in U} es un mínimo local de la función y si la función J : U → R {\displaystyle J:U\to \mathbb {R} } es diferenciable (en sentido de Fréchet) en el entorno de dicho punto, entonces

D J ( u ) ( v − u ) ≥ 0 , ∀ : v ∈ U {\displaystyle \mathrm {D} J(u)(v-u)\geq 0,\qquad \forall :v\in U}

La desigualdad anterior se denomina desigualdad de Euler.

El teorema anterior es válido para cualquier función sea convexa o no, mientras que el siguiente es válido solo para funciones convexas:

(Convexidad y derivada) Sea J : U → R {\displaystyle J:U\to \mathbb {R} } una función definida sobre un conjunto convexo U {\displaystyle U\,} de un espacio normado, entonces:

a) La función J {\displaystyle J\,} es convexa en su dominio si y solo si: J ( v ) ≥ J ( u ) + D J ( u ) ( v − u ) , ∀ : u , v ∈ U {\displaystyle J(v)\geq J(u)+\mathrm {D} J(u)(v-u),\qquad \forall :u,v\in U} b) La función J {\displaystyle J\,} es estrictamente convexa en su dominio si y solo si: J ( v ) > J ( u ) + D J ( u ) ( v − u ) , ∀ : u , v ∈ U , u ≠ v {\displaystyle J(v)>J(u)+\mathrm {D} J(u)(v-u),\qquad \forall :u,v\in U,u\neq v}

El significado geométrico del teorema anterior es claro, el teorema implica simplemente que la función en todo punto está por encima del plano tangente en un punto. El siguiente teorema es válido para funciones convexas que son dos veces diferenciables (y por tanto admiten una forma bilineal que generaliza la matriz hessiana):

(Convexidad y segunda derivada) Sea J : U → R {\displaystyle J:U\to \mathbb {R} } una función definida sobre un conjunto convexo U {\displaystyle U\,} de un espacio normado y que sea dos veces diferenciable, entonces:

a) La función J {\displaystyle J\,} es convexa en su dominio si y solo si: D 2 J ( u ) ( v − u , v − u ) ≥ 0 , ∀ : u , v ∈ U {\displaystyle \mathrm {D} ^{2}J(u)(v-u,v-u)\geq 0,\qquad \forall :u,v\in U} b) Si D 2 J ( u ) ( v − u , v − u ) > 0 , ∀ : u , v ∈ U , u ≠ v {\displaystyle \mathrm {D} ^{2}J(u)(v-u,v-u)>0,\qquad \forall :u,v\in U,u\neq v} La función es estrictamente convexa en su dominio.

Nótese que en este último caso el recíproco de la afirmación b) no es cierto en general, por ejemplo considérese U = R ,   J ( u ) = u 4 {\displaystyle U=\mathbb {R} ,\ J(u)=u^{4}} cuya segunda derivada en el origen se anula y, sin embargo, la función sigue siendo estrictamente convexa.

El último teorema impone restricciones sobre el número de mínimos que puede tener una función convexa y su naturaleza:

(mínimos de funciones convexas) Sea J : U → R {\displaystyle J:U\to \mathbb {R} } una función definida sobre un conjunto convexo U {\displaystyle U\,} de un espacio normado, entonces:

a) Cualquier mínimo local de la función J {\displaystyle J\,} de hecho es un mínimo absoluto (aunque no todo mínimo absoluto es un mínimo local). b) Si J {\displaystyle J\,} es estrictamente convexa, tiene como mucho un único mínimo, y es un mínimo estricto. c) Si U {\displaystyle U\,} es un conjunto abierto, entonces un punto u ∈ U {\displaystyle u\in U} es un mínimo si y solo si D J ( u ) = 0 {\displaystyle \mathrm {D} J(u)=0}

Véase también

Referencias

Enlaces externos