Historia
Isaac Newton (1641–1727) fue uno de los científicos más brillantes de todos los tiempos. El final del siglo fue un periodo vibrante para la ciencia y las matemáticas, y el trabajo de Newton tocó casi todos los aspectos de esta última ciencia. Se presentó su método de resolución para encontrar la raiz de la ecuación . A pesasr de que demostró el método sólo para polimonios, es claro que conocia sus aplicaciones más amplias.
Joseph Raphson (1648-1715) proporcionó una descripción de método de Isaac Newton en 1690 y reconoció a Newton como la fuente del descubrimiento. Ni Newton ni Raphson utilizaron explicitamente la derivada en su descripción ya que ambos sólo consideraron polimonios. Otros matemáticos, en especial James Gregory (1636-1675), estaba conscientes del proceso subyacente en esa época o antes.
El Método de Newton-Raphson
El método de Newton es un método abierto, en el sentido de que no está garantizada su convergencia global. La única manera de alcanzar la convergencia es seleccionar un valor inicial lo suficientemente cercano a la raíz buscada. Así, se ha de comenzar la iteración con un valor razonablemente cercano al cero (denominado punto de arranque o valor supuesto). La relativa cercanía del punto inicial a la raíz depende mucho de la naturaleza de la propia función; si ésta presenta múltiples puntos de inflexión o pendientes grandes en el entorno de la raíz, entonces las probabilidades de que el algoritmo diverja aumentan, lo cual exige seleccionar un valor supuesto cercano a la raíz. Una vez que se ha hecho esto, el método linealiza la función por la recta tangente en ese valor supuesto. La abscisa en el origen de dicha recta será, según el método, una mejor aproximación de la raíz que el valor anterior. Se realizarán sucesivas iteraciones hasta que el método haya convergido lo suficiente.
Sea una función derivable definida en el intervalo real . Empezamos con un valor inicial y definimos para cada número natural
Donde denota la derivada de .
Nótese que el método descrito es de aplicación exclusiva para funciones de una sola variable con forma analítica o implícita conocible. Existen variantes del método aplicables a sistemas discretos que permiten estimar las raíces de la tendencia, así como algoritmos que extienden el método de Newton a sistemas multivariables, sistemas de ecuaciones, etcétera.
Algoritmo
Tres son las formas principales por las que tradicionalmente se ha obtenido el algoritmo de Newton-Raphson.
La primera de ellas es una simple interpretación geométrica. En efecto, atendiendo al desarrollo geométrico del método de la secante, podría pensarse en que si los puntos de iteración están lo suficientemente cerca (a una distancia infinitesimal), entonces la secante se sustituye por la tangente a la curva en el punto. Así pues, si por un punto de iteración trazamos la tangente a la curva, por extensión con el método de la secante, el nuevo punto de iteración se tomará como la abscisa en el origen de la tangente (punto de corte de la tangente con el eje . Esto es equivalente a linealizar la función, es decir, se reemplaza por una recta tal que contiene al punto (, ()) y cuya pendiente coincide con la derivada de la función en el punto, . La nueva aproximación a la raíz, , se logra de la intersección de la función lineal con el eje de abscisas. Matemáticamente:
En la ilustración adjunta del método de Newton se puede ver que es una mejor aproximación que para el cero de la función .
Una forma alternativa de obtener el algoritmo es desarrollando la función en serie de Taylor, para un entorno del punto :
Si se trunca el desarrollo a partir del término de grado 2, y evaluamos en :
Si además se acepta que tiende a la raíz, se ha de cumplir que , luego, sustituyendo en la expresión anterior, obtenemos el algoritmo.
Finalmente, hay que indicar que el método de Newton-Raphson puede interpretarse como un método de iteración de punto fijo. Así, dada la ecuación , se puede considerar el siguiente método de iteración de punto fijo:
Se escoge de manera que ( es la raiz buscada). Dado que es:
Entonces:
Como no tiene que ser único, se escoge de la forma más sensilla:
Por lo tanto, inponiendo subíndices:
Convergencia
El orden de convergencia de este método es, por lo menos, cuadrático. Sin embargo, si la raíz buscada es de multiplicidad algebraica mayor a uno (i.e, una raíz doble, triple, …), el método de Newton-Raphson pierde su convergencia cuadrática y pasa a ser lineal de constante asintótica de convergencia 1-1/m, con m la multiplicidad de la raíz.
Existen numerosas formas de evitar este problema, como pudieran ser los métodos de aceleración de la convergencia tipo Δ² de Aitken o el método de Steffensen.
Evidentemente, este método exige conocer de antemano la multiplicidad de la raíz, lo cual no siempre es posible. Por ello también se puede modificar el algoritmo tomando una función auxiliar , resultando:
Su principal desventaja en este caso sería lo costoso que pudiera ser hallar y si no es fácilmente derivable.
Por otro lado, la convergencia del método se demuestra cuadrática para el caso más habitual sobre la base de tratar el método como uno de punto fijo: si , y es distinto de 0, entonces la convergencia es cuadrática. Sin embargo, está sujeto a las particularidades de estos métodos.
Nótese de todas formas que el método de Newton-Raphson es un método abierto: la convergencia no está garantizada por un teorema de convergencia global como podría estarlo en los métodos de falsa posición o de bisección. Así, es necesario partir de una aproximación inicial próxima a la raíz buscada para que el método converja y cumpla el teorema de convergencia local.
Estimación del error
Se puede demostrar que el método de Newton-Raphson tiene convergencia cuadrática: si {\displaystyle \alpha }\alpha es raíz, entonces:
para una cierta constante . Esto significa que si en algún momento el error es menor o igual a 0,1, a cada nueva iteración doblamos (aproximadamente) el número de decimales exactos. En la práctica puede servir para hacer una estimación aproximada del error:
Error relativo entre dos aproximaciones sucesivas:
Con lo cual se toma el error relativo como si la última aproximación fuera el valor exacto. Se detiene el proceso iterativo cuando este error relativo es aproximadamente menor que una cantidad fijada previamente.