Red de conocimiento de divisas - Preguntas y respuestas sobre viajes - ¿Quién es más adecuado para el análisis de datos, el lenguaje R o Excel?

¿Quién es más adecuado para el análisis de datos, el lenguaje R o Excel?

Las dos herramientas se utilizan de maneras muy diferentes. Cuando se utiliza Excel, la mayor parte del trabajo se puede realizar con clics del mouse y se puede acceder a varias herramientas en diferentes partes de la interfaz. Por lo tanto, Excel es muy cómodo de usar (la práctica hace la perfección), pero procesar datos con Excel lleva mucho tiempo y, si asume un nuevo proyecto, deberá repetir estos procesos de forma monótona. Cuando se usa R, todo se hace en código. Usted carga datos en la memoria y luego ejecuta scripts para explorar y procesar los datos. Puede que esta herramienta no sea fácil de usar, pero tiene varias ventajas.

Creo que, conceptualmente, R es más conveniente de usar. Si está trabajando con varias columnas de datos, verá todos los datos aunque esté trabajando en una sola tarea. Cuando se usa R, todos los datos están en la memoria y solo se pueden ver cuando se llaman los datos. Si está realizando una transformación o un cálculo, está procesando un subconjunto de columnas o filas relevantes y todos los demás datos están en segundo plano. Creo que es más fácil concentrarse en la tarea que tenemos entre manos. Una vez que complete la tarea, puede guardarla en un marco de datos que contenga solo los datos de columna o fila requeridos. Usted construye el conjunto de datos correcto para resolver el problema en cuestión. Esto puede parecer trivial, pero en realidad tiene enormes beneficios.

Usando R, puedes repetir fácilmente las mismas operaciones para otros conjuntos de datos. Debido a que todos los datos se procesan y estudian mediante código, es fácil realizar las mismas operaciones en nuevos conjuntos de datos. Cuando se utiliza Excel, la mayoría de las operaciones se realizan con clics del mouse. Aunque la experiencia del usuario es buena, las operaciones repetidas con datos nuevos consumen mucho tiempo y son aburridas. r solo necesita cargar un nuevo conjunto de datos y ejecutar el script nuevamente.

De hecho, se puede operar con códigos, lo que también es conveniente para realizar diagnósticos y disfrutar de los resultados de sus análisis. Cuando se utiliza Excel, la mayoría de los resultados de los análisis se basan en la memoria (tabla dinámica aquí, editor de fórmulas en otra tabla, etc. En R, todo se hace a través del código de un vistazo). Si está corrigiendo un error, sabe exactamente a dónde ir y si desea disfrutar de los resultados, simplemente copie y pegue el código. Cuando busque ayuda en línea, explique con precisión los datos utilizados y haga preguntas específicas. De hecho, muchas veces, cuando haces preguntas en línea, la gente publica directamente códigos precisos para resolver tus problemas.

La organización de proyectos en R es más sencilla. En Excel, necesito preparar una serie de tablas, y posiblemente varios libros, y luego nombrarlos apropiadamente, y los nombres de los archivos no deben repetirse. Las notas de mi proyecto se guardan en archivos separados. La organización de mi proyecto R tiene una carpeta separada donde se coloca todo en lo que trabajo. Datos limpios, gráficos exploratorios y modelos. Esto hace que sea más fácil para mí entenderlo y encontrarlo, y también para otras personas con las que trabajo. Por supuesto, también se puede organizar Excel. Creo que la simplicidad de R hace que sea más fácil de usar.

Solo se puede decir que los puntos anteriores son la guinda del pastel, no la esencia. Antes de estas funciones, usé Excel durante varios años y tú también deberías hacerlo. Ahora quiero hablar sobre las diferencias reales entre R y Excel. Lo que quiero decir es que, además de las ventajas anteriores, R es más adecuado para el análisis de datos. He aquí por qué.

Puedes cargar cualquier dato en R, no importa dónde o cómo se guarden los datos. Puede cargar archivos CSV, leer JSON, realizar consultas SQL o extraer sitios web. Incluso puedes procesar big data en R a través de Hadoop.

r es un completo conjunto de herramientas que utiliza paquetes de datos. r es más práctico que Excel para analizar datos. Puede utilizar R para la gestión, clasificación y regresión de datos, así como para procesar imágenes y realizar todas las demás operaciones. Si el aprendizaje automático es tu especialidad, cualquier algoritmo que se te ocurra es pan comido. Actualmente hay más de 5000 paquetes disponibles para R, por lo que no importa con qué tipo de datos desee trabajar, R puede manejarlos.

上篇: ¿De quién es la foto de un veterano con medallas en el pecho? 下篇: Pabellón de Polonia en la sede de la Exposición Mundial de Shanghai
Artículos populares