sábado, 27 de marzo de 2010

UNIDAD 3: PROCESAMIENTO DE DATOS

3.1.- La medición

La medición es la determinación de la proporción entre la dimensión o suceso de un objeto y una determinada unidad de medida. La dimensión del objeto y la unidad deben ser de la misma magnitud. Una parte importante de la medición es la estimación de error o análisis de errores.
Es comparar la cantidad desconocida que queremos determinar y una cantidad conocida de la misma magnitud, que elegimos como unidad. Teniendo como punto de referencia dos cosas: un objeto (lo que se quiere medir) y una unidad de medida ya establecida ya sea en Sistema Ingles, Sistema Internacional, o Sistema Decimal.

Al resultado de medir lo llamamos Medida: Cuando medimos algo se debe hacer con gran cuidado, para evitar alterar el sistema que observamos. Por otro lado, no hemos de perder de vista que las medidas se realizan con algún tipo de error, debido a imperfecciones del instrumental o a limitaciones del medidor, errores experimentales, por eso, se ha de realizar la medida de forma que la alteración producida sea mucho menor que el error experimental que se pueda cometer.

La medida o medición diremos que es directa, cuando disponemos de un instrumento de medida que la obtiene, así si deseamos medir la distancia de un punto a un punto b, y disponemos del instrumento que nos permite realizar la medición, esta es directa.

Errores en las medidas directas: El origen de los errores de medición es muy diverso, pero podemos distinguir:

Errores sistemáticos: son los que se producen siempre, suelen conservar la magnitud y el sentido, se deben a desajustes del instrumento, desgastes etc. Dan lugar a sesgo en las medidas.
Errores aleatorios: son los que se producen de un modo no regular, variando en magnitud y sentido de forma aleatoria, son difíciles de prever, y dan lugar a la falta de calidad de la medición.

Se desarrolla con el objetivo de obtener la información numérica acerca de una propiedad o cualidad del objeto o fenómeno, donde se comparan magnitudes medibles y conocidas. Es decir es la atribución de valores numéricos a las propiedades de los objetos. En la medición hay que tener en cuenta el objeto y la propiedad que se va a medir, la unidad y el instrumento de medición, el sujeto que realiza la misma y los resultados que se pretenden alcanzar.

En las ciencias sociales, naturales y técnicas no basta con la realización de las mediciones, sino que es necesaria la aplicación de diferentes procedimientos que permitan revelar las tendencias, regularidades y las relaciones en el fenómeno objeto de estudio, uno de estos procedimientos son los estadísticos, tanto los descriptivos como los inferenciales.

3.2.- La estadística

La estadística es una herramienta con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio.
Distribución normal. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales.

La estadística se divide en dos elementos:

La estadística descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, clústeres, etc.

La inferencia estadística, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. Hay también una disciplina llamada estadística matemática, la cual se refiere a las bases teóricas de la materia. La palabra «estadísticas» también se refiere al resultado de aplicar un algoritmo estadístico a un conjunto de datos, como en estadísticas económicas, estadísticas criminales, etc.
Un dato individual es un dato de un solo individuo, mientras que un dato estadístico es un dato de una muestra o de una población en su conjunto. Por ejemplo, la edad de Juan es un dato individual, mientras que el promedio de edades de una muestra o población de personas es un dato estadístico.Por esta razón un dato estadístico nada dice respecto de los individuos, porque solamente describe la muestra o población.

Los datos estadísticos que describen una muestra suelen llamarse estadísticos (por ejemplo, el promedio de ingresos mensuales de las personas de una muestra), mientras que los datos estadísticos descriptores de una población suelen llamarse parámetros (por ejemplo, el promedio de ingresos mensuales de las personas de una población).

3.3.- Nueva Hipótesis.

Una hipótesis puede estar basada simplemente en una sospecha, en los resultados de otros estudios y la esperanza de que una relación entre una o más variables se den en el estudio en cuestión. O pueden estar basadas en un cuerpo de teorías que, por un proceso de deducción lógica, lleva a la predicción de que, si están presentes ciertas condiciones, se darán determinados resultados.

La elaboración de una buena hipótesis tiene como punto de partida el conocimiento del área en la que se desea hacer la investigación, sin este conocimiento previo se corre el riesgo de recorrer caminos ya transitados y trabajar en temas ya tratados que carecen de interés para la ciencia.
Si la hipótesis se basa u origina de otros estudios, la investigación estará en clara relación con un cuerpo de conocimientos ya existentes, probados, por lo que el trabajo será una contribución que permitirá reforzar ese cuerpo de conocimientos.

La Hipótesis en el campo de la Ciencia es una poderosa herramienta científica. Permite sustentar todo un trabajo, una investigación, además de dar las condiciones para que la Ciencia sea comprobable o no. La Hipótesis es pues una base firme en la búsqueda del conocimiento científico. Por lo cual puede considerarse como el primer paso en la construcción del mismo.

La Hipótesis no sólo implica un primer acercamiento al objeto de estudio, además es el puente que permite unir la realidad con las demás estructuras de interpretación científica de la Realidad. Es decir, la Hipótesis permite plantear elementos tales como las Leyes Científicas y las Teorías.

Son guías precisas del problema de investigación o fenómeno que se estudia. En una investigación se pueden tener más de una hipótesis, también puede no tener hipótesis. Las hipótesis indican lo que se está buscando o tratando de probar, son explicaciones tentativas del fenómeno. investigado, formuladas en forma de proposiciones. Existen algunos criterios para la formulación de hipótesis:

-Siempre se formulan en forma afirmativa.
-Deben plantear la relación entre dos o más variables.
-Deben posibilitar el someter a prueba las relaciones expresadas.
-Deben ser de poder predictivo o explicativo.
-Las hipótesis no necesariamente son verdaderas, pueden no ser, pueden o no comprobarse los hechos.
Al formular las hipótesis debemos recordar que:
-Los conceptos involucrados deben ser claros y precisos.
-Los conceptos deben contar con realidades observables y empíricas.
3.4.- procesamiento de datos (manual o electrónica)

Es la Técnica que consiste en la recolección de los datos primarios de entrada, que son evaluados y ordenados, para obtener información útil, que luego serán analizados por el usuario final, para que pueda tomar las decisiones o realizar las acciones que estime conveniente.
Los diferentes métodos de procesamiento y están relacionados con el avance tecnológico. Las alternativas presentadas podrán ser elegidas, dependiendo de la rapidez con que se necesitan y la inversión en dinero que se requiera para obtenerlas.

Los tipos de procesamiento que existen, son los siguientes:

a. Proceso Manual: Este es el proceso más antiguo e involucra el uso de los recursos humanos, tales como realizar cálculos mentales, registrar datos con lápiz y papel, ordenar y clasificar manualmente. Esto da como resultado un proceso lento y expuesto a generar errores a lo largo de todas las etapas o actividades del ciclo de procesamiento. Finalmente los resultados se expresan de manera escrita, creando grandes volúmenes de información escrita almacenada.
Como ejemplo podemos tener la evaluación académica en un colegio, en donde el profesor registra en forma manual, a lapicero, las notas de evaluación de los alumnos en una tabla llamada registro, para luego obtener los promedios mediante cálculos aritméticos manuales, quedando toda esta información almacenada en su registro.

b. Proceso Mecánico: Considera el uso de máquinas registradoras y calculadoras, como el ábaco y las reglas de cálculo, reemplazando en cierto grado el proceso de cálculo manual. Esto trae como lógica consecuencia el aligeramiento del trabajo en relación al proceso y la reducción de errores, pero mantiene la desventaja del proceso de almacenamiento de toda la información
Procesos Electrónicos: En este tipo de proceso se emplean las computadoras, por lo que la intervención humana no es requerida en cada etapa. Una vez ingresados los datos, el computador efectúa los procesos requeridos automáticamente y emite el resultado deseado.
Los procesos son realizados a velocidades increíblemente altas, obteniendo información confiable. Un ejemplo práctico lo tenemos en el empleo de las computadoras personales que se usan en el hogar, para llevar los gastos diarios de la casa, ver recetas de cocina y otros.

Hasta el momento hemos supuesto que los datos que maneja una aplicación no son tan voluminosos y por lo tanto caben en memoria. Cuando recurrimos a archivos se debe a la necesidad de conservar datos después de que termina un programa, por ejemplo para apagar el computador.

Sin embargo, existen problemas en donde el volumen de datos es tan grande que es imposible mantenerlos en memoria. Entonces, los datos se almacenan en un conjunto de archivos, los que forman una base de datos. Una base de datos es por lo tanto un conjunto de archivos que almacenan, por ejemplo, datos con respecto al negocio de una empresa.

Cada archivo se forma en base a un conjunto de líneas y cada línea está formada por campos de información. Todas las líneas de un mismo archivo tienen la misma estructura, es decir los mismos campos de información. Diferentes archivos poseen estructuras distintas.