[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [escepticos] ** FW: virus alert



Pedro Maicas wrote:
>   Claro que en windows nadie instala un shell tipo unix para
> linea de comandos, ni tenemos utilidades como grep, sed, ...
> Pero si esto fuera imprescindible lo tendríamos instalado, es
> solo  cuestion de compilar unos fuentes de dominio público,
> y estoy seguro que tienen que existir ports de todas estas
> herramientas para windows. Seguro que muchos gurus de unix
> se las instalan en sus windoses, ellos se quedaron estancados
> hace años en aquella maravilla que era la redireccion de

Una anecdota en la que se compara la potencia 
relativa de Windows y un ambiente tipo UNIX (Solaris 
en este caso). Hace unos meses recibi un estudiante 
que debia hacer un trabajo de estadistica con datos 
reales. Su maquina era Windows, pero todos sus programas 
de tratamiento de datos se atragantaban con el fichero 
de datos que habia obtenido, el cual tenia 700 MB en forma 
de una una sola linea largisima de caracteres ASCII. Los
registros deberian estar colocados en lineas separadas, 
y los campos deberian ocupar columnas fijas, pero en la 
practica los registros estaban contiguos todos en un sola 
largisima linea de 700 MB (no habia nada entre ellos, no 
era un problema de conversion de cambios de linea entre 
sistemas). Ademas contenia un peque~no numero de caracteres 
no imprimibles insertados aqui y alla.

En mi maquina con Solaris use el programa "less" (sucesor de 
"more") para mirar algunos pedazos del fichero y deducir su 
estructura, y luego escribi un programa de unas pocas lineas 
en C para procesarlo, dividiendo los registros en lineas separadas 
y sustituyendo los caracteres no imprimibles por adecuados caracteres 
imprimibles.  Luego con un programa en perl (tambien de solo unas 
lineas) seleccione ciertos registros y campos (segun instrucciones 
del estudiante), hasta dejar un limpio fichero de poco mas de 3 MB 
que el chico no tuvo dificultad en procesar con sus programas 
habituales.

Quiza eso se habria podido hacer tambien en Windows, pero 
con mas tiempo y esfuerzo, suponiendo que en esa maquina 
haya alguna herramienta para mirarle las "tripas" a un fichero 
con una sola linea de 700 millones de caracters (no lo intentes 
con Word). 


Miguel A. Lerma