Escribir el constructor de una clase es algo que parece trivial… A fin de cuentas, el constructor se encarga de construir un objeto, ¿no? Pero la realidad es que escribir constructores no es tan sencillo como parece. ¿Qué significa “construir” un objeto? Por supuesto cada clase tendrá sus propias necesidades, pero hay una serie de guías y buenas prácticas que nos pueden ayudar a tomar ciertas decisiones. A esto va dedicado este post.
Guia 1: Haz lo mínimo posible en el constructor
Sean cuales sean las necesidades de tu clase, haz que el constructor haga lo mínimo posible. Técnicamente un constructor no debería poder fallar casi nunca. De hecho el constructor debería limitarse a guardarse los parámetros necesarios y poca cosa más. Evita constructores que hagan demasiadas cosas. Veamos dos ejemplos contrapuestos. El primero la clase FileStream. El siguiente código:
- using (var fs = new FileStream(@"C:\\foo.txt", FileMode.Open, FileAccess.Read))
- {
- }
Falla si no existe el fichero C:\foo.txt o si el usuario no tiene permisos, o si dicho fichero existe pero está bloqueado. El constructor intenta abrir el fichero, una operación que por un lado es potencialmente larga (el fichero puede estar en una carpeta remota) y por otra tiene muchas posibilidades de fallo. El constructor de FileStream hace demasiadas cosas. Hubiese sido mejor si hubiesen seguido otra aproximación. P. ej. la de SqlConnection. El siguiente código no falla nunca:
- using (var con = new SqlConnection("server=100.0.0.1;database=myDb;uid=myUser;password=myPass;"))
- {
- }
Da absolutamente igual que el servidor exista o no, o que la base de datos exista, o que el usuario tenga permisos. El constructor no intenta establecer conexión alguna y delega operación en un método de instancia (Open). Eso tiene varias ventajas:
- Crear objetos SqlConnection es una tarea sencilla y asegura al desarrollador que el tiempo en hacerlo es corto y que los fallos son inexistentes.
- El desarrollador puede retardar la llamada a la operación que puede fallar y/o tardar tiempo todo lo necesario.
- Se puede proporcionar una versión asíncrona (la propia clase SqlConnection define OpenAsync), lo que no es posible si el constructor realizara esas operaciones (no hay constructores asíncronos).
En resúmen FileStream debería proporcionar un método Open en lugar de intentar abrir el fichero desde el constructor. Al no hacerlo, implica que el desarrollador debe diferir la creación entera del objeto lo más tarde posible (en lugar de diferir solo la operación potencialmente costosa), lo que obliga a lidiar con posibles referencias null y/o usar otras técnicas como Lazy<T>.
Guía 2 –No llames métodos virtuales desde el constructor
O ándate con ojo si lo haces. Eso es de hecho un warning del compilador, así que deberíamos prestarle atención. La razón es que, dada una clase A, que define un método virtual m() y una clase B que hereda de A y redefine el método virtual, cuando el constructor de A llame al método m(), el método llamado no tiene porque ser el método de la clase A, si no que puede ser el método de la clase derivada (B), que se ejecutará antes que el propio constructor de la clase derivada.
Reconozco que explicado así puede costar de entender, así que mejor verlo con un ejemplo. Empecemos por la clase A:
- class A
- {
- public A()
- {
- m();
- }
- protected virtual void m()
- {
- }
- }
El constructor de A, llama al método virtual m(). En este caso no hace nada más, en un caso real, probablemente el constructor de A haría algo antes y algo después y se quiere dar la opción a las clases derivadas de personalizar parte del comportamiento. Da igual, no es relevante. Veamos ahora la clase B:
- class B : A
- {
- private string _name;
- private int _len;
- public B(string name)
- {
- _name = name ?? "";
- }
- protected override void m()
- {
- base.m();
- _len = _name.Length;
- }
- }
La clase B hereda de A y redefine m. A priori no parece que haya nada incorrecto en el código, ¿verdad? Hasta que hacemos:
- var b = new B("hola");
Y obtenemos una NullReferenceException en el método m() de B. ¿Y eso? Pues muy sencillo:
- Estamos creando un objeto de tipo B
- La clase B hereda de A, por lo que primero se ejecuta el constructor de la clase base (A) antes que el constructor propio (B)
- El constructor de la clase A llama al método m que es virtual y por lo tanto se ejecuta el método basándose en el tipo de objeto. El objeto es de tipo B por lo que se ejecuta el método m() de la clase B a pesar de estar llamado desde el constructor de la clase A.
- El método m() de la clase B accede a una propiedad _name, que se inicializa en el constructor de la clase B, todavía no ejecutado. Así que _name vale null y obtenemos nuestra excepción.
De hecho, de nuevo, llamar a métodos virtuales desde un constructor suele ser indicación de que, quizá, el constructor hace demasiadas cosas.
¿Constructores o métodos estáticos?
Esa es una muy buena pregunta. No tengo una respuesta contundente, solo aspectos que podemos considerar:
- Un método estático puede devolver null en lugar de tener que lanzar una excepción.
- Un método estático puede devolver instancias previamente creadas (aplicar memoización, especialmente en el caso de objetos inmutables).
- Un método estático puede devolver un objeto de un subtipo si es necesario.
- Un método estático puede tener cualquier nombre, lo que puede hacer el código más legible.
- Al ver “new” queda claro que se crea un objeto. Llamando a un método estático puede ser más confuso (¿se está creando realmente un objeto?).
Hay gente que cuando el constructor va más allá de hacer algo sencillo prefieren usar un método estático. P. ej. el método File.OpenRead, devuelve un FileStream configurado para leer un fichero. Vale, en el fondo se limita a llamar al constructor de FileStream con unos determinados parámetros (aunque no es el caso File.OpenRead podría hacer otras cosas como devolver null si el fichero no existe, en lugar de propagar la excepción lanzada por el constructor de FileStream). La clave ahí está en que al ser File.OpenRead un método, uno puede esperar una semántica más compleja que la que pueda esperar de un constructor. Es decir, usar un método estático es una manera de decir “hey, eso crea un objeto, pero lo hace de una forma que es más compleja que la habitual”. También permite agrupar la creación y la inicialización (p. ej. un método estático SqlConnection.OpenNew() podría crear y abrir una conexión, todo a la vez).
Veamos un ejemplo (está forzado, luego cuento el por qué, pero como ejemplo nos servirá): System.Guid. Uno puede esperar que para crear un Guid baste con hacer:
- var guid = new Guid();
Pero la realidad es que con esto obtenemos el Guid vacío, con valor igual a cero, que no es muy útil (generalmente queremos que los Guids sean identificadores únicos). Para conseguir un Guid único debemos usar un método estático:
- var guid = Guid.NewGuid();
No se me ocurre ninguna razón por la cual este comportamiento no podría ser el del constructor por defecto (y más cuando tenemos Guid.Empy para obtener el Guid vacío). Cuando creamos un Guid raramente queremos el Guid vacío, queremos eso, un Guid único. Crear un Guid único no es una operación costosa ni que a priori deba fallar: basta con inicializar con cierto algoritmo los valores del Guid. Antes he dicho que este ejemplo estaba forzado y es que realmente hay una razón de peso por la que System.Guid se comporte así y es que es una struct, no una clase. Las structs tienen siempre un constructor por defecto que no se puede redefinir, de ahí que realmente los creadores de System.Guid no tenían otra opción. Es una limitación del lenguaje lo que les ha obligado a esa aproximación, pero bueno… me ha servido como ejemplo. Es uno de esos casos en que una limitación del lenguaje afecta al diseño de un tipo 😉
Personalmente, si hay muchas maneras de crear un objeto, a partir de distintos tipos de parámetros prefiero tener varios métodos estáticos antes que muchas sobrecargas del constructor. Un ejemplo de esto en el framework lo tenemos con la clase (realmente struct, pero ahora sí que no importa) DateTime. DateTime tiene 12 constructores, pero realmente esos 12 constructores son “dos” constructores que tienen todos los parámetros opcionales (de ahí las sobrecargas). Podemos agrupar los 12 constructores en:
- 10 constructores que nos permiten crear un DateTime a partir de un áño, mes, día, hora, minuto, segundo y calendario.
- 2 constructores que nos permiten crear un DateTime a partir de unos ticks y un calendario
Además de estos “dos” constructores tenemos varios métodos estáticos en DateTime tales como FromBinary o FromFileTime para obtener un DateTime a partir de otros elementos. Nos podemos preguntar por qué para crear un DateTime a partir de ticks se usa el constructor y para hacerlo a partir del tiempo de un fichero lo hacemos usando un método estático. Hay, de hecho, una razón técnica: tanto los ticks y el tiempo de un fichero es un long. Obviamente no podemos tener dos constructores que ambos acepten solo un long, así que los diseñadores de la clase han optado por el constructor en un caso (el que, probablemente, consideran más “normal”) y en un método estático en el otro. ¿Mi opinión? He dicho antes que los 12 constructores de DateTime son realmente dos, que definen dos maneras de crear un DateTime (a partir de año, mes, día y demás y a partir de ticks). Yo, quizá, hubiese eliminado los dos constructores que usan ticks y hubiese creado un método estático FromTicks. ¿Por qué? Pues porque intento que el constructor defina la forma canónica (normal, habitual) de crear un tipo. Por supuesto alguien puede considerar que tan habitual es crear un DateTime a partir de ticks como usando años, meses y demás. Bajo este punto de vista, no me parece mal que ambos mecanismos sean los constructores. Pero sí intento esto: que el constructor defina la forma habitual de crear un objeto. Si hay otros mecanismos, adicionales, prefiero que estén en métodos estáticos.
Por supuesto, esto es solo una opinión 🙂
¿Cuantos parámetros debe tener el constructor?
Para responder a esta pregunta creo que debemos distinguir si los parámetros recibidos son dependencias del objeto o meramente lo describen. P. ej. podríamos suponer una clase SolidRectangle con un constructor que aceptase 9 parámetros: x, y, altura, anchura, color de relleno, color de línea, estilo de relleno, estilo de línea y transparencia. ¿Esos 9 parámetros son demasiados? En este caso, realmente, esos 9 parámetros se limitan a describir el rectángulo como tal. Si 9 parámetros en el constructor nos parecen demasiados, tenemos otras aproximaciones:
- Sustituir algunos (o todos) de esos parámetros por propiedades. Pero con esto perdemos la posibilidad de que los objetos SolidRectangle sean inmutables. Muchas veces la inmutabilidad es una característica deseable.
- Agrupar esos parámetros en un objeto tipo “SolidRectangleProps” que, básicamente, contiene esas mismas propiedades (o casi todas ellas). Esta aproximación reduce en efecto los parámetros del constructor de 9 a quizá 1, pero realmente no ha cambiado nada sustancial. Si “SolidRectangleProps” solo se usa para crear objetos SolidRectangle realmente no hemos ganada nada. Otra cosa es si a partir de un SolidRectangle puedo extraer sus “SolidRectangleProps” y usar este objeto para crear otros SolidRectangle o incluso otro tipo de figuras.
Lo importante es tener claro que un número elevado de parámetros en el constructor no es malo “per se” y agruparlos en un objeto tampoco tiene por qué aportar nada concreto. Otra cosa es si esos parámetros son dependencias del objeto. En este caso, si tenemos muchas dependencias es un síntoma de que nuestra clase puede estar rompiendo el SRP. Así, p. ej. si un controlador de ASP.NET MVC recibe 9 parámetros, es para revisarlo (los controladores no se “describen” así que esos 9 parámetros seguro que son dependencias). Este es un error en el que se cae muy frecuentemente cuando se usa inyección de dependencias.
Y nada, eso es todo… ¡Espero que esas ideas y reflexiones te hayan resultado útiles!
Saludos! 😉
Yo cada vez más soy más defensor de los métodos estáticos. Me permite estar lo más cerca posible de mi lenguaje OO favorito, el Eiffel, cuyos constructores son procedimientos (métodos void) normales y corrientes, con su nombre y todo. Salvo que haya una única forma razonable de crear el objeto (DTOs con todos los campos obligatorios y poco más), prefiero tener constructores privados y exponer sólo los estáticos. El único posible inconveniente que señalas (perder la visibilidad de si realmente estás creando un objeto, o si haces más cosas), creo que es fácilmente subsanable con convenciones de nombrado adecuadas. Además creo que los métodos estáticos «constructores» de cierta complejidad deben estar en otra clase distinta de la que generan, para señalizar que son una factoría con enjundia. Por ejemplo, «OpenRead» está en «File» y no en «FileStream», a pesar de que crea uno.
Buenas Ignacio!
Gracias por el comentario… Al final, la discusión entre métodos estáticos vs constructores parece que va bastante según lenguajes. En «Effective Java» recomiendan los primeros antes que los segundos, pero la realidad es que la mayoría de código Java que he visto usa más constructores que otra cosa.
En C++ usar métodos estáticos (de la misma clase) incluso tiene un nombre: se llama «Named constructor idiom» (en este caso la razón es que queremos dar nombres significativos para hacer el código más claro).
En fin… todo un mundo 😉