Lenguajes y Paradigmas de Programación
 

Tema 1: Lenguajes de programación

Historia de los lenguajes de programación

Desde 1954 hasta la actualidad se han documentado más de 2.500 lenguajes de programación (consultar en The Language List). Entre 1952 y 1972, la primera época de los lenguajes de programación, se desarrollaron alrededor de 200 lenguajes, de los que una decena fueron realmente siginificativos y tuvieron influencia en el desarrollo de lenguajes posteriores.

Una lista parcial de algunos de los lenguajes de programación más importantes, junto con su año de creación:

  • 1957 FORTRAN
  • 1958 ALGOL
  • 1960 Lisp
  • 1960 COBOL
  • 1962 APL
  • 1962 SIMULA
  • 1964 BASIC
  • 1964 PL/I
  • 1970 Prolog
  • 1972 C
  • 1975 Pascal
  • 1975 Scheme
  • 1975 Modula
  • 1983 Smalltalk-80
  • 1983 Objective-C
  • 1983 Ada
  • 1986 C++
  • 1986 Eiffel
  • 1987 Perl
  • 1988 Tcl/Tk
  • 1990 Haskell
  • 1991 Python
  • 1993 Ruby
  • 1995 Java
  • 1995 PHP
  • 2000 C#

Un diagrama de los lenguajes más importantes y sus dependencias:

Éric Lévénez ha hecho el esfuerzo de construir un árbol genealógico de los lenguajes de programación, que indica la fecha en la que cada lenguaje fue creado y la influencia que ha tenido en los lenguajes posteriores. Consultar el documento PDF y la web de Éric Lévénez.

La Torre de Babel, representa el gran número de lenguajes de programación. Esta imagen se usó en la portada de Programming Languages: History and Fundamentals, de J. E. Sauel, 1969, Prentice Hall.

Al principio, los lenguajes se diseñaban únicamente para poder ejecutar los programas eficientemente. Los ordenadores, carísimos, eran el recurso crítico, y los programadores eran bastante baratos. Un lenguaje de alto nivel tenía que ser competitivo con la ejecución de un código en ensamblador. A mediados de los años 60, cuando se habían diseñado FORTRAN, COBOL, LISP y ALGOL, John Backus (creador de FORTRAN) se dio cuenta que la programación estaba cambiando. Las máquinas eran menos caras, el coste de la programación estaba aumentando, aparecía la necesidad de mover o migrar los programas de unas estaciones a otras, y surgía la necesidad de llevar un buen mantenimiento de los programas resultantes. El objetivo de un lenguaje de alto nivel se transformó no sólo en en ejecutar los programas eficientemente, sino también en facilitar el desarrollo de programas para resolver problemas en determinadas áreas de aplicación.

La tecnología de los ordenadores maduró entre 1960 y 1970 y los lenguajes se centraron en resolver problemas específicos de un dominio. Los programas científicos generalmente se implementaban en FORTRAN, las aplicaciones para los negocios en COBOL, las aplicaciones militares en JOVIAL, las de inteligencia artificial en LISP y las militares internas en Ada. Al igual que sucede con los lenguajes naturales, los lenguajes de programación a veces dejan de usarse. ALGOL no se utiliza desde los años 60, se reemplazó por Pascal, el cual se reemplazó a su vez por C++ y Java. COBOL, que se utilizaba para las aplicaciones mercantiles, se sustituyó también por C++.

Los primeros lenguajes que todavía se usan tienen revisiones periódicas para reflejar influencias de otras áreas de computación. Lenguajes como Java, C++ y ML reflejan una gran experiencia obtenida en el diseño y uso de los cientos de lenguajes antiguos. Algunas de esas influencias son:

  • Recursos del ordenador: la evolución de los ordenadores desde los años 50, junto con los modernos sistemas operativos, han influenciado las características de los lenguajes de alto nivel.
  • Aplicaciones: el uso de los ordenadores se ha extendido rápidamente desde las aplicaciones militares, científicas y de negocios a los juegos, los ordenadores personales, internet y cualquier aplicación cotidiana.
  • Métodos de programación: el diseño de los lenguajes tiene que reflejar los buenos métodos para implementar programas grandes y complejos.
  • Estudios teóricos: Gracias a la investigación durante más de 50 años en el diseño e implementación de lenguajes, se conocen los puntos fuertes y débiles de las características de los mismos, por lo que influye en el diseño de los nuevos lenguajes.
  • Estandarización: cada vez más existe la necesidad de que los programas sean portables de unos sistemas a otros.

La siguiente tabla (extraida del libro Programming Languages. Design and Implementation, de Terrence W. Pratt y Marvin V. Zelkowitz) muestra una pequeña lista de los lenguajes y las influencias que fueron importante a finales del siglo 20.

A pesar de la enorme lista de lenguajes de programación que han ido apareciendo, la mayor parte de los programadores sólo utilizan unos pocos lenguajes. Además, los programadores a menudo trabajan en empresas o instalaciones donde se trabaja con un único lenguaje en particular, como Java, C o Ada. Entonces, os preguntarés por qué es importante el estudio de diferentes lenguajes o paradigmas cuando al final sólo trabajaréis con unos pocos. Hay muchas razones que justifican su estudio, entre las cuales las más importantes son:

  • Mejora el uso del lenguaje de programación: si se conoce cómo están implementadas las características en un lenguaje de programación, se mejorará la habilidad para escribir programas eficientes. Por ejemplo, si se conoce cómo crear y manipular listas o cadenas en un lenguaje, por ejemplo Scheme, utilizando recursión se conseguirá construir programas más eficientes.
  • Incrementa el vocabulario de los elementos de programación.
  • Permite una mejor elección del lenguaje de programación: El conocimiento de diversos lenguajes de programación facilitan la elección del lenguaje más adecuado para un proyecto determinado.
  • Mejora la habilidad para desarrollar programas efectivos y eficientes: Muchos lenguajes proporcionan características que, cuando se utilizan correctamente, aportan muchos beneficios a la programación pero, cuando se hace un uso incorrecto, pueden ocasionar un gran coste computacional. El ejemplo típico es la recursión, que permite una implementación elegante y eficiente de funciones. Pero cuando no se sabe utilizar, puede ocasionar un aumento exponencial del tiempo de ejecución.
  • Facilita el aprendizaje de un nuevo lenguaje de programación: Cuando se conocen las estructuras, técnicas de implementación y construcciones de un lenguaje, es mucho más sencillo aprender un nuevo lenguaje de programación que tenga estructuras similares.
  • Facilita el diseño de nuevos lenguajes de programación: Es posible que en un futuro tengais que diseñar vosotros un lenguaje que se adapte a vuestras necesidades. Cuantos más lenguajes y paradigmas se conozcan, más sencillo resultará el diseño y la implementación.

La historia de los lenguajes de programación es dinámica y se encuentra en continua expansión. El gran número de lenguajes de programación que han aparecido desde los años 60 hasta la actualidad no son ni mucho menos los únicos que aparecerán en un futuro.

A continuación tenemos una lista extraida de freshmeat donde se puede ver el número de proyectos activos basados en cada lenguaje de programación en la actualidad.

  • Ada (67 projects)
  • APL (3 projects)
  • ASP (47 projects)
  • Assembly (272 projects)
  • Awk (68 projects)
  • Basic (39 projects)
  • C (9296 projects)
  • C# (344 projects)
  • C++ (5207 projects)
  • Clipper (1 project)
  • Cold Fusion (25 projects)
  • Common Lisp (67 projects)
  • D (15 projects)
  • Delphi (80 projects)
  • Dylan (2 projects)
  • Eiffel (35 projects)
  • Emacs-Lisp (66 projects)
  • Erlang (39 projects)
  • Euler (1 project)
  • Euphoria (10 projects)
  • Forth (29 projects)
  • Fortran (94 projects)
  • Gambas (11 projects)
  • Groovy (42 projects)
  • Haskell (76 projects)
  • Java (6337 projects)
  • JavaScript (1260 projects)
  • Lisp (88 projects)
  • Logo (6 projects)
  • Lua (60 projects)
  • ML (33 projects)
  • Modula (8 projects)
  • Object Pascal (35 projects)
  • Objective C (390 projects)
  • OCaml (98 projects)
  • Other (310 projects)
  • Other Scripting Engines (173 projects)
  • Pascal (63 projects)
  • Perl (3816 projects)
  • PHP (4521 projects)
  • Pike (13 projects)
  • PL/SQL (95 projects)
  • Pliant (1 project)
  • PROGRESS (4 projects)
  • Prolog (24 projects)
  • Python (3323 projects)
  • REALbasic (14 projects)
  • Rebol (3 projects)
  • Rexx (11 projects)
  • Ruby (512 projects)
  • Scheme (151 projects)
  • Simula (1 project)
  • Smalltalk (24 projects)
  • SQL (565 projects)
  • Tcl (523 projects)
  • Unix Shell (1119 projects)
  • Visual Basic (49 projects)
  • XBasic (1 project)
  • YACC (32 projects)
  • Zope (48 projects)

En la siguiente web Timeline of Programming Languages tenemos una lista de los lenguajes que han aparecido cronológicamente desde los años 50. Es interesante ver los que han aparecido desde el año 2000 al 2007 (21 lenguajes).

Cuando los lenguajes de programación empezaron a aparecer, los creadores normalmente eran entidades o empresas. Hoy en día es diferente, cualquier informático puede crear un lenguaje nuevo en un momento dado que precise ciertas características en concreto. Por ejemplo, tenemos el caso de Ruby, un lenguaje de programación ideado en 1993 por un joven japonés llamado Yukihiro Matsumoto. Quiso crear un lenguaje donde la programación funcional y la imperativa estuviese balanceada. Necesitaba además que fuese un lenguaje de script más potente que Perl y más orientado a objetos que Phyton.

El nombre de Ruby se decidió entre Yukihiro y Keiju Ishitsuka en 1993 en una sesión online de chat, antes de que se hubiese implementado el código. Se propusieron dos nombres, Ruby y Coral, y al final decidieron Ruby porque era la piedra del zodiaco de uno de sus colegas.

La primera versión pública Ruby 0.95 se anunció en un grupo de noticias domésticas en Japón en diciembre de 1995. A continuación se lanzaron tres versiones más y se creó el grupo de noticias ruby-list. La versión Ruby 1.0 apareció en diciembre de 1996, la versión 1.3 en 1999 y la 1.8.7 en junio de 2008. La última versión que se ha lanzado Ruby 1.9.1 ha sido el 25 de Enero de 2009.

Ruby es un lenguaje orientado a objetos pero multiparadigma: esto quiere decir que en ruby cada tipo de dato es un objeto y cada función es un método, pero permite programación imperativa y funcional (multiparadigma).

Un ejemplo de programación en Ruby:

puts "Hello World!"

Otro ejemplo:

puts "What's your favorite number?"
number = gets.chomp
output_number = number.to_i + 1
puts output_number.to_s + ' is a bigger and better favorite number.'

Elementos de los lenguajes de programación

Hemos visto el gran número de lenguajes de programación que se han desarrollado en la historia de la informática. A pesar de la gran variedad de lenguajes desarrollados, hay unos elementos comunes a todos ellos. ¿Cuáles son? ¿Qué hace que algo pueda ser considerado un lenguaje de programación?

No son lenguajes de programación

Existen elementos muy usados por los informáticos que tienen algunas de las características de los lenguajes de programación, pero que no lo son. Veamos algún ejemplo.

Los lenguajes XML, uno de los estándares más usados por las aplicaciones informáticas para compartir datos, son lenguajes escritos con una sintaxis perfectamente definida. Por ejemplo, el siguiente texto en un lenguaje XML para definir una lista de persones:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE people_list SYSTEM "example.dtd">
<people_list>
  <person>
    <name>Fred Bloggs</name>
    <birthdate>27/11/2008</birthdate>
    <gender>Male</gender>
  </person>
  <person>
    <name>Mary Baggins</name>
    <birthdate>12/07/1942</birthdate>
    <gender>Female</gender>
  </person>
</people_list>

Sin embargo le falta una característica fundamental para poder ser considerado un lenguaje de programación: no define un comportamiento, no tiene una semántica asociada. El trozo de código anterior no puede ser ejecutado tal cual en un computador, sino que únicamente define un conjunto de datos.

Un entorno de programación visual para definir comportamientos y animaciones es otro ejemplo de algo que no es estrictamente un lenguaje de programación. Por ejemplo Scratch es un lenguaje visual desarrollado por el MIT para promover el interés por la programación entre los jóvenes.

El ejemplo anterior define una animación de un sprite en la pantalla. Otro entornos o herramienta similar es el Adobe Director, que permite diseñar animaciones multimedia. ¿Los podemos considerar lenguajes de programación? Si lo consideramos de una forma estricta, no. No son lenguajes textuales, los programas no se pueden escribir en un fichero de texto. Tampoco tienen elementos fundamentales de los lenguajes de programación como son las funciones y los tipos de datos. Aunque, por otro lado, si consideramos de una forma más amplia el concepto de función, sí que existen elementos en esos lenguajes que posibilitan la creación de abstracciones reutilizables en distintos programas.

Podríamos decir que son herramientas de programación de animaciones que utilizan ciertas características de los lenguajes de programación.

Características de los lenguajes de programación

¿Cuáles son estas características?

Según la definición de la Encyclopedia of Computer Science (Encyclopedia of Computer Science, 4th Edition, Anthony Ralston (Editor), Edwin D. Reilly (Editor), David Hemmendinger (Editor), Wiley, 2000. Disponible en la biblioteca politécnica con identificador: POE R0/E/I/ENC/RAL):

"A programming language is a set of characters, rules for combining them, and rules specifying their effects when executed by a computer, which have the following four characteristics:

  1. It requires no knowledge of machine code on the part of the user
  2. It has machine independence
  3. Is translated into machine language
  4. Employs a notation that is closer to that of the specific problem being solved than is machine code"

Según Abelson y Sussman, en el libro que vamos a seguir en nuestra asignatura (SICP, p. 1):

"We are about to study the idea of a computational process. Computational processes are abstract beings that inhabit computers. As they evolve, processes manipulate other abstract things called data. The evolution of a process is directed by a pattern of rules called a program. [...] The programs we use to conjure processes are like a sorcerer's spells. They are carefully composed from symbolic expressions in arcane and esoteric programming languages that prescribe the tasks we want our processes to perform."

Y después, en la página 4, añaden otra idea fundamental:

"A powerful programming language is more than just a means for instructing a computer to perform tasks. The language also serves as a framework within which we organize our ideas about processes. Thus, when we describe a language, we should pay particular attention to the means that the language provides for combining simple ideas to form more complex ideas."

Así, entre las características de un lenguaje de programación podemos remarcar las siguientes:

  • Define un proceso que se ejecuta en un computador
  • Es de alto nivel, cercano a los problemas que se quieren resolver (abstracción)
  • Permite construir nuevas abstracciones que se adapten al dominio que se programa

Para Abelson y Sussman, todos los lenguajes de progamación permiten combinar ideas simples en ideas más complejas mediante los siguientes tres mecanismos:

  • expresiones primitivas, que representan las entidades más simples del lenguaje
  • mecanismos de combinación con los que se construyen elementos compuestos a partir de elementos más simples
  • mecanismos de abstracción con los que dar nombre a los elementos compuestos y manipularlos como unidades

Cuando se habla de elementos en el párrafo anterior nos estamos refiriendo tanto a datos como a programas.

Una breve lista de características comunes a todos los lenguajes de programación:

  • Tienen una sintaxis: un conjunto de reglas que definen qué expresiones de texto son correctas. Por ejemplo, en C todas las sentencias deben terminar en ';'.
  • Los lenguajes de programación se ejecutan en un computador y tienen una determinada semántica que define cuál será el resultado de la ejecución de un programa.
  • Definen un conjunto de tipos de datos primitivos que representan los posibles valores que pueden devolver las expresiones del lenguaje.
  • Tienen mecanismos de abstracción para definir nuevos tipos de datos a partir de los primitivos o nuevas funciones y procedimientos.

Abstracción

El concepto de abstracción es fundamental en informática. Para modelar un dominio (sistema de información de una universidad, sistema de sensores de una planta química, etc.) es necesario definir distintas abstracciones que nos permitan tratar sus elementos.

Una abstracción agrupa un conjunto de elementos (datos y procedimientos) y le da un nombre. Por ejemplo, cuando hablamos del sistema de información de una universidad identificamos elementos como:

  • Estudiantes
  • Asignaturas
  • Matrícula
  • Expediente académico
  • ...

Existen abstracciones propias de la computación, que se utilizan en múltiples dominios. Por ejemplo, abstracciones de datos como:

  • Listas
  • Árboles
  • Grafos
  • Tablas hash

También existen abstracciones que nos permiten tratar con dispositivos y ordenadores externos:

  • Fichero
  • Raster gráfico
  • Protocolo TCP/IP

Uno de los trabajos principales de un informático es la construcción de abstracciones que permitan ahorrar tiempo y esfuerzo a la hora de tratar con la complejidad del mundo real.

Tal y como dice Joel Spolsky en su blog Joel on Software:

"TCP is what computer scientists like to call an abstraction: a simplification of something much more complicated that is going on under the covers. As it turns out, a lot of computer programming consists of building abstractions. What is a string library? It's a way to pretend that computers can manipulate strings just as easily as they can manipulate numbers. What is a file system? It's a way to pretend that a hard drive isn't really a bunch of spinning magnetic platters that can store bits at certain locations, but rather a hierarchical system of folders-within-folders containing individual files that in turn consist of one or more strings of bytes."

Una misión fundamental de los lenguajes de programación es proporcionar herramientas que sirvan para construir estas abstracciones.

Paradigmas de programación

Existe una enorme variedad de lenguajes de programación, no sólo en cuanto a su sintaxis, sino también en cuanto a su comportamiento o semántica.

Hemos visto que cada año el número de lenguajes se incrementa, de forma que para los informáticos es prácticamente imposible conocer cada nuevo lenguaje que aparece. Pero eso no es un problema, ya que todos esos lenguajes tienen características comunes y se pueden agrupar en cuatro grandes grupos o modelos computacionales llamados paradigmas.

Imagen del libro Programming Languages. Design and Implementation, de Terrence W. Pratt y Marvin V. Zelkowitz.

Todos los lenguajes pertenecen a uno de esos cuatro paradigmas. De forma que, si se conocen las características de los paradigmas de programación, es muy sencillo aprender a programar en un nuevo lenguaje, porque tendrá las características del paradigma de programación al que pertenezca.

El origen de la palabra paradigma entendida como un marco general en el que se desarrollan teorías científicas se encuentra en el trabajo de 1962 del filósofo e historiador de la ciencia Thomas S. Kuhn, La estructura de las revoluciones científicas. Esa palabra ha sido después adoptada por el mundo de la computación para definir un conjunto de ideas y principios comunes de grandes grupos de lenguajes de programación.

La definición de la palabra paradigma más cercana a lo que se quiere decir en la expresión paradigma de programación es la siguiente:

"Un marco filosófico y teórico de una escuela o disciplina científica en el que se formulan teorías, leyes y generalizaciones y los experimentos realizados en soporte de ellas."

Un paradigma define un conjunto de reglas, patrones y estilos de programación que son usados por los lenguajes de programación que usan ese paradigma.

Podemos distinguir cuatro grandes paradigmas de programación:

  • Paradigma funcional
  • Paradigma lógico
  • Paradigma imperativo o procedural
  • Paradigma orientado a objetos

Algunas características importantes de cada uno de estos paradigmas.

Paradigma funcional

En el paradigma funcional la computación se realiza mediante la evaluación de expresiones.

  • Definición de funciones
  • Funciones como datos primitivos
  • Valores sin efectos laterales, no existe la asignación
  • Programación declarativa
(define (factorial x)
   (if (= x 0)
      1
      (* x (factorial (- x 1)))))

>(factorial 8)
40320
>(factorial 30)
265252859812191058636308480000000

Paradigma lógico

  • Definición de reglas
  • Unificación como elemento de computación
  • Programación declarativa
padrede('juan', 'maria'). % juan es padre de maria
padrede('pablo', 'juan'). % pablo es padre de juan
padrede('pablo', 'marcela').
padrede('carlos', 'debora').

hijode(A,B) :- padrede(B,A).
abuelode(A,B) :-  padrede(A,C), padrede(C,B).
hermanode(A,B) :- padrede(C,A) , padrede(C,B), A \== B.        

familiarde(A,B) :- padrede(A,B).
familiarde(A,B) :- hijode(A,B). 
familiarde(A,B) :- hermanode(A,B).

?- hermanode('juan', 'marcela').
yes
?- hermanode('carlos', 'juan').
no
?- abuelode('pablo', 'maria').
yes
?- abuelode('maria', 'pablo').
no

Paradigma imperativo

Los lenguajes de programación que complen el paradigma imperativo se caracterizan por tener un estado implícito que es modificado mediante instrucciones o comandos del lenguaje. Como resultado, estos lenguajes tienen una noción de secuenciación de los comandos para permitir un control preciso y determinista del estado.

  • Definición de procedimientos
  • Definición de tipos de datos
  • Chequeo de tipos en tiempo de compilación
  • Cambio de estado de variables
  • Pasos de ejecución de un proceso
type 
   tDimension = 1..100;
   eMatriz(f,c: tDimension) = array [1..f,1..c] of real;
   
   tRango = record
      f,c: tDimension value 1;
   end;
   
   tpMatriz = ^eMatriz;


procedure EscribirMatriz(var m: tpMatriz);
var filas,col : integer;
begin
   for filas := 1 to m^.f do begin
      for col := 1 to m^.c do
         write(m^[filas,col]:7:2);
      writeln(resultado);
      writeln(resultado)
     end;    
end;

Paradigma orientado a objetos

  • Definición de clases y herencia
  • Objetos como abstracción de datos y procedimientos
  • Polimorfismo y chequeo de tipos en tiempo de ejecución
public class Bicicleta {
    public int marcha;
    public int velocidad;
	
    public Bicicleta(int velocidadInicial, int marchaInicial) {
        marcha = marchaInicial;
        velocidad = velocidadInicial;
    }
	
    public void setMarcha(int nuevoValor) {
        marcha = nuevoValor;
    }
	
    public void frenar(int decremento) {
        velocidad -= decremento;
    }
	
    public void acelerar(int incremento) {
        velocidad += incremento;
    }
}

public class MountainBike extends Bicicleta {
    public int alturaSillin;

    public MountainBike(int alturaInicial, int velocidadInicial, int marchaInicial) {
        super(velocidadInicial, marchaInicial);
        alturaSillin = alturaInicial;
    }	
	
    public void setAltura(int nuevoValor) {
        alturaSillin = nuevoValor;
    }	
}

public class Excursion {
   
	public static void main(String[] args) {
	   MountainBike miBicicleta = new MoutainBike(10,10,3);
	   miBicicleta.acelerar(10);
	   miBicicleta.setMarcha(4);
	   miBicicleta.frenar(10);
	}
}

Una reflexión importante es que la separación entre los paradigmas y los lenguajes no es estricta. Existen ideas comunes a distintos paradigmas, así como lenguajes de programación que soportan más de un paradigma. Por ejemplo, el paradigma funcional y lógico comparten características declarativas, mientras que el paradigma orientado a objetos y procedural tienen características imperativas.

Otros paradigmas de programación menos comunes:

  • Paradigmas de programación paralela y concurrente
  • Paradigmas basados en restricciones
  • Paradigmas visuales

Se puede encontrar más información sobre distintos paradigmas de programación en la Wikipedia.

Scheme Como lenguaje de programación

Algunos ejemplos de Scheme

Scheme es un lenguaje interpretado. Podemos lanzar un intérprete de Scheme y teclear en el prompt algunas expresiones. El intérprete analizará la expresión y mostrará el valor resultante de evaluarla.

2
(+ 2 3)
(+)
(+ 2 4 5 6)
(+ (* 2 3) (- 3 1))

Las expresiones en Scheme tienen una forma denominada notación prefija de Cambridge (Cambridge prefix notation) (el nombre de Cambridge es por la localidad Cambridge, Massachusets, donde reside el MIT, lugar en el que se ideó el Lisp), en la que la expresión está delimitada por paréntesis y el operando va seguido de los operadores.

La sintaxis es la siguiente:

(<función> <arg1> ... <argn>)

En Scheme podemos interpretar los paréntesis abiertos '(' como evaluadores o lanzadores de la función que hay a continuación.

La forma de evaluar una expresión en Scheme es muy sencilla:

  1. Evaluar cada uno de los argumentos
  2. Aplicar la función nombrada tras el paréntesis a los valores resultantes de la evaluación anterior
(+ (* 2 3) (- 3 (/ 12 3)))
(+ 6 (- 3 (/ 12 3)))
(+ 6 (- 3 4))
(+ 6 -1)
5
Atención, preguntas
- ¿En qué orden se evalúan los argumentos?
- ¿Influye ese orden en el resultado de la evaluación?

En Scheme los términos función y procedimiento significan lo mismo y se usan de forma intercambiable. Son ejemplos de funciones o procedimientos: +, -, *.

En Scheme la evaluación de una función siempre devuelve un valor, a no ser que se produzca un error que detiene la evaluación:

(* (+ 3 4) (/ 3 0))

Podemos utilizar la forma especial define para darle un nombre (identificador, símbolo) a un valor. Una vez definido, podemos usar el nombre en lugar del valor. Ya veremos más adelante que esto es equivalente a decir que el símbolo se evalúa al valor.

> (define pi 3.14159)
> pi
3.14159
> (sin (/ pi 2))
0.9999999999991198
> (define a (+ 2 (* 3 4)))
> a
14

¿Por qué Scheme?

Scheme es un dialecto de Lisp.

Scheme es un lenguaje actual. Existen múltiples proyectos y bibliotecas que se están implementando en la actualidad en Scheme. Algunos ejemplos:

Scheme es un lenguaje ideal para LPP porque:

  • Tiene una sintaxis muy sencilla
  • Es un lenguaje de script
  • Tiene múltiples extensiones: programación orientada a objetos, etc.
  • Es posible de extender mediante macros

Existen a su vez múltiples intérpretes de Scheme, nosotros vamos a usar uno de las más extendidos: MzScheme en el entorno de programación DrScheme (desarrollados por el grupo PLT Scheme). Para una breve introducción al lenguaje y al entorno de programación consultar el manual A brief tour of DrScheme escrito por el mismo grupo.

Algunas primitivas

Recordemos del apartado anterior que un lenguaje de programación define unos:

  • procedimientos primitivos
  • mecanismos de composición
  • mecanismos de abstracción

Vamos a revisar Scheme desde esta perspectiva.

Las primitivas de Scheme consisten en un conjunto de tipos de datos, formas especiales y funciones incluidas en el lenguaje. A lo largo del curso iremos introduciendo estas primitivas. Es un lenguaje no demasiado complejo (a diferencia de otros como C++ o Java). Está descrito completamente en un documento de especificación de 50 páginas llamado Revised 5 Report on the Algorithmic Language Scheme (se puede consultar en este enlace). Las primitivas del lenguaje están descritas en las 21 páginas del apartado 6 (Standard procedures). En la actualidad este documento se encuentra en revisión y en breve se aprobará el estándar 6.

Vamos a revisar los tipos de datos primitivos de Scheme, así como algunos procedimientos primitivos para trabajar con valores de esos tipos.

  • Booleanos
  • Números
  • Caracteres
  • Cadenas
  • Símbolos
  • Parejas y listas (*)
  • Vectores (*)
  • Procedimientos

(*) Los veremos en detalle en futuras clases, cuando hablemos de tipos de datos compuestos. En la clase de hoy sólo veremos unas algunas funciones elementales para crea, recorrer y añadir listas.

Booleanos

#t           ; verdadero
#f           ; falso
(> 3 1.5)
(= 3 3.0)
(equal? 3 3.0)
(or (< 3 1.5) #t)
(and #t #t #f)
(not #f)
(not 3)
Atención, aviso
- Nótese en los ejemplos la diferencia entre (= 3 3.0) y (equal? 3 3.0).

Números

La cantidad de tipos numéricos que soporta Scheme es grande. Sólo vamos a ver una pequeña parte.

number
complex
real
rational
integer

Algunos procedimientos primitivos

(<= 2 3 3 4 5)
(max 3 5 10 1000)
(/ 22 4)
(quotient 22 4)
(remainder 22 4)
(equal? 0.5 (/ 1 2))
(= 0.5 (/ 1 2))
(abs (* 3 -2))
(floor 3.4)   ; relacionados: ceiling, truncate, round
(sin 2.2)     ; relacionados: cos, tan, asin, acos, atan

Caracteres

#\a
#\A
#\space
#\ñ         ; se soportan caracteres internacionales
#\á         ; se codifican en UTF-8
(char<? #\a #\b)
(char-numeric? \#1) ; relacionados: char-alphabetic?
                    ; char-whitespace?, char-upper-case?
                    ; char-lower-case?
(char-upcase #\ñ)
(char->integer #\space)

Cadenas

Las cadenas son secuencias finitas de caracteres.

"hola"
"La palabra \"hola\" tiene 4 letras"
(make-string 10 #\o)
(substring "Hola que tal" 2 4)
(string? "hola")
(string->list "hola")

Símbolos

Un símbolo es lo que en otros lenguajes se denomina identificador. En Scheme los símbolos e identificadores pueden contener caracteres internacionales (Unicode, UTF-8). El intérprete DrScheme guarda los ficheros de texto en esa codificación.

'hola
(symbol 'hola-que<>)
(symbol->string 'hola-que<>)
'mañana
'lápiz  ; aunque sea posible, no vamos a usar acentos en los símbolos
        ; pero sí en los comentarios
(symbol? 'hola) ; #t
(symbol? "hola") ; #f
(equal? 'hola 'hola)
(equal? 'hola "hola")

Diferencia entre símbolos y cadenas: un símbolo (identificador) es un objeto simple y una cadena es un objeto compuesto. El intérprete de Scheme codifica un símbolo mediante un único número, su valor hash. Otra diferencia bastante clara: un símbolo no puede contener un espacio, pero una cadena sí.

Listas

Uno de los elementos fundamentales de Scheme, y de Lisp, son las listas. Vamos a ver cómo definir, crear, recorrer y concatenar listas.

(list 1 2 3 4)     ; list crea una lista
'(1 2 3 4)         ; otra forma de definir la misma lista
(car '(1 2 3 4))   ; primer elemento de la lista
(cdr '(1 2 3 4))   ; resto de la lista
'()                ; lista vacía 
(cdr '(1))         ; devuelve la lista vacía
(null? (cdr '(1))) ; comprueba si una lista es vacía
(append '(1) '(2 3 4) '(5 6)) ; construye una lista nueva concatenando
                              ; los argumentos
Atención, aviso
Uno de los conceptos más importantes relacionados con las listas es el de lista vacía. La comprobación de si una lista es vacía con la función null? es el caso base de gran parte de funciones recursivas que recorren listas.

Procedimientos

Una característica fundamental de Scheme es que los procedimientos son tipos primitivos. Más adelante veremos esto en detalle.

+
-
remainder

Extensiones de Scheme

Es posible definir nuevos procedimientos en Scheme (lo explicamos en el siguiente apartado). Vamos a usar también un conjunto de procedimientos definidos en el fichero simply.scm. Son procedimientos definidos en el libro 'Simply Scheme: Introducing Computer Science' de Brian Harvey and Matthew Wright.

Los procedimientos que vamos a usar más a menudo son procedimientos para tratar con símbolos y cadenas (composición, primer carácter, etc.): first, butfirst (bf), last, butlast (bl), word, empty? y member?. Además define la función 1+ que incrementa en 1 su argumento.

(load "/home/domingo/simply.scm") ; en Windows: (load "C:\simply.scm")
(first 'hola)
(butfirst 'hola)
(bf 'hola)
(last 'hola)
(butlast 'hola)
(word 'hola 'mundo)
(word 12 34)
(+ (first 23) 5)
(empty? "hola")
(empty? (bf "h"))
(empty? (bf 'h))
(member? 'f 'abcdefg)
true
false
(1+ 4)

Abstracción: define

Las capacidades de abstracción de un lenguaje de programación hacen posible definir nuevos elementos y darles un nombre. En otros lenguajes de programación (Java, C++, etc.) es posible definir nuevos tipos de datos (clases), definir procedimientos y funciones de esos tipos de datos, definir constantes, etc.

En Scheme sólo tenemos una instrucción para definir nuevos elementos: define (más adelante veremos que esto no es completamente cierto, ya que podemos definir macros con la instrucción define-syntax).

Hemos visto que podemos usar define para darle un nombre (identificador, símbolo) a un valor.

> (define pi 3.14159)
> pi
3.14159
> (sin (/ pi 2))
0.9999999999991198
> (define a (+ 2 (* 3 4)))
> a
14

La sintaxis de define es:

(define <símbolo> <expresión>)

La forma especial (define símbolo expresión) se evalúa así:

  1. Evaluar expresión
  2. Asociar el valor resultante de la evaluación anterior con el símbolo

El otro uso de define es para definir nuevos procedimientos (aunque ya veremos más adelante que Scheme utiliza siempre el define anterior, y que esta forma del define no es más que azucar sintáctico).

La sintaxis para definir un procedimiento es:

(define (<nombre-funcion> <args>) <cuerpo>)

Se define una función con el nombre, argumentos y cuerpo dados. El cuerpo es una expresión de Scheme. El resultado de evaluar la última expresión del cuerpo es el valor devuelto por al función.

Ejemplos:

> (define (cuadrado x) 
   (* x x))
> (cuadrado 2)
4
> (cuadrado 3 4 5) ; error

(define (plural pal) 
   (word pal 's))
> (plural 'perro)
perros
> (plural 'arbol)
arbols

Algunos ejemplos curiosos (en Scheme los símbolos no están protegidos):

(define suma +)
(suma 1)
(suma 1 2 3)
(define + -)
(+ 2 3)
(suma 2 3)
(define + suma)

Estos ejemplos explican un poco más la idea de que en Scheme los procedimientos son valores primitivos. Al hacer (define + -) estamos asociando el identificador '+' al procedimiento 'resta' que resulta de evaluar el identificador '-'.

Estructuras de control

El otro elemento comúm a todos los lenguajes de programación (aparte de la abstracción y de las primitivas) es la posibilidad de componer expresiones sencillas en expresiones compuestas.

Hemos visto que una de las características de Scheme es la composición de funciones. Scheme también define estructuras de control que nos permiten seleccionar qué parte de una expresión evaluamos en función del resultado de la evaluación de otras.

Las estructuras más importantes de Scheme son el if y el cond para realizar una evaluación condicional.

El nombre que reciben en Scheme todas las expresiones que no son procedimientos y que tienen una evaluación especial es forma especial. Ejemplos de formas especiales son: define, if, cond.

Atención, aviso
- La expresión (+ (* 2 3) 4) se evalúa de una forma distinta de (define a 3). En el primer caso estamos evaluando llamadas a funciones, y en el segundo evaluamos una forma especial.

Forma especial 'if'

La forma especial if realiza una evaluación condicional de las expresiones que la siguen, según el resultado de una condición.

(define x 3)

(if (> x 5) 
   'mayor-que-cinco 
   'menor-o-igual-que-cinco)
    
(define (vocal? x)
   (member? x 'aeiou))

(define (plural pal)
   (if (vocal? (last pal))
      (word pal 's)
      (word pal 'es)))

Para que un programa Scheme sea legible es muy importante la indentación (tabulación) correcta de sus expresiones.

La sintaxis de if es:

(if <condición> <exp-verdad> <exp-falso>)

El funcionamiento de la forma especial es:

  1. Evaluar condición
  2. Si el resultado es true evaluar exp-verdad
  3. Sino evaluar exp-falso
(if (> 3 2) (* 2 3) (/ 2 0))

En la expresión anterior la condición es verdadera, por lo que no se evalúa la expresión (/ 2 0) que daría un error. Se evalúa sólo (* 2 3) y se devuelve su resultado.

Forma especial 'cond'

La forma especial cond evalúa una serie de condiciones y devuelve el valor de la expresión asociada a la primera condición verdadera.

(cond
   ((> 3 4) '3-es-mayor-que-4)
   ((< 2 1) '2-es-menor-que-1)
   ((= 3 1) '3-es-igual-que-1)
   ((= 2 2) '2-es-igual-que-2)
   ((> 3 2) '3-es-mayor-que-2)
   (else 'ninguna-condicion-es-cierta))

; juego del ding: 1,2,ding,4,5,ding,7,8,ding,10,11,ding,ding,14,ding,...

(define (ding x)
   (cond 
      ((= (remainder x 3) 0) 'ding)
      ((member? 3 x) 'ding)
      (else x)))

La sintaxis de cond es la siguiente:

(cond 
   (<exp-cond-1> <exp-consec-1>)
   (<exp-cond-2> <exp-consec-2>)
   ...
   (else <exp-consec-else>)) 

La semántica es la siguiente:

  1. Se evalúan de forma ordenada todas las expresiones hasta que una de ellas devuelva #t
  2. Si alguna expresión devuelve #t, se devuelve el valor del consecuente de esa expresión
  3. Si ninguna expresión es cierta, se devuelve el valor resultante de evaluar el consecuente del 'else'
Se hace notar
- En cualquier caso, sólo se evalúa un único consecuente del cond.

¿Y los bucles?

En programación funcional pura no existe el concepto de bucle tan extendido en los lenguajes de programación imperativos. Ya veremos que no es necesario si tenemos la recursión. Cualquier función en donde se necesite repetir una sentencia un número de veces (o hasta que se cumpla una determinada condición) se puede expresar de forma recursiva.

Aunque en Scheme existe la forma especial (do ...) que permite implementar un bucle nosotros no vamos a usarla. El uso de esta forma especial nos aparta del paradigma funcional, ya que su semántica no puede definirse con el modelo de sustitución que veremos en las próximas clases.

Por ejemplo, las siguientes funciones son equivalentes. En C, usando un bucle while

suma-hasta (k) {
   suma=0;j=0;
   while (j<=k) {
      suma = suma+j;
      j++;
   }
}

En Scheme, usando la recursión:

(define (suma-hasta k)
   (if (= k 0)
      0
      (+ k (suma-hasta (- k 1)))))

Referencias

Para saber más de los temas que hemos tratado en esta clase puedes consultar las siguientes referencias: