Informe de big data del usuario principal de Zhihu
Recientemente escribí un rastreador para rastrear la información pública de los usuarios principales de Zhihu 3W. Aunque Zhihu afirma tener 65 millones de usuarios registrados y 18,5 millones de usuarios activos diarios, una gran parte de ellos son usuarios de Sanwu. Dado que este grupo de usuarios no publica muchos datos y la nueva versión del servidor Zhihu tiene un límite en el número máximo de solicitudes para una única IP (aproximadamente una vez por segundo), solo rastreé a los 30.000 usuarios principales.
Mis reglas de rastreo son las siguientes: seleccione aleatoriamente 10 Zhihu V con decenas de miles de seguidores como semillas, rastree a las personas que siguen por turno y luego rastree a los seguidores de las personas que siguen. a la persona, de forma recursiva. En otras palabras, las reglas del rastreador aseguran que todos los que ingresan a la base de datos tengan al menos un seguidor. El siguiente análisis de datos proviene de la información obtenida por los rastreadores, así que perdónenme si hay alguna desviación en el informe.
El primer paso es realizar un análisis de la nube de palabras sobre las descripciones profesionales de los usuarios de Zhihu y enumerar las 100 palabras más frecuentes. Los resultados son los siguientes.
En el análisis de palabras de alta frecuencia en las descripciones de puestos de trabajo, "Internet" gana con una frecuencia de 4552 veces, seguido de "universidad" con una frecuencia de 2163. Esto es consistente con lo que usualmente vemos como profesionales de Internet y estudiantes de universidades prestigiosas que ocupan la fuerza principal en la producción de contenidos. Estas cien palabras de alta frecuencia también incluyen los intereses, la residencia y otra información de los usuarios de Zhihu, pero las analizaremos detenidamente en el futuro.
Primero echemos un vistazo a los distintos "más" de Zhihu. ¿Cuáles tienen mayor número de me gusta, más seguidores y más respuestas escritas?
La primera es la lista de ranking con mayor número de votos.
En términos de número de aprobaciones, el maestro @张家伟 superó por sí solo el segundo lugar por más del doble, lo que lo convierte en un ganador seguro. Luego, los cinco primeros son @飞发猫, @Zhuxuan, @Tangque y @马前paw. Brother Wheel ocupó el sexto lugar.
Entonces veamos el ranking de más seguidores.
En el ranking de seguidores, el profesor @张家伟 todavía está muy por delante del profesor @李凯富. Más atrás están los grandes de Zhihu @黄记新 y @zhou元, y aún más atrás está @yolfilm.
Veamos el ranking de las respuestas más escritas.
@Phil ganó el primer lugar con el mayor número de respuestas con un rendimiento extremadamente alto, mientras que @vczh, conocido como el "caballito", solo pudo conformarse con el segundo lugar. Los cinco primeros incluyen a @王如峰, @Chaijianyi, @zhen-liang y otros grandes vs.
Echemos un vistazo a la lista de clasificación de las preguntas más frecuentes.
@David Chang ocupó el primer lugar con 2684 preguntas, y @TuringDon, famoso por su gráfico de conocimiento futuro, ocupó el segundo lugar. Los cinco primeros también son @憆yan, @成汉, @张梁.
Luego hay una comparación del número de empleados en la tercera fábrica BAT. Esta comparación se basa en estadísticas de la frecuencia de las palabras de descripción de la ocupación del usuario rastreada.
Se puede ver que Goose Factory tiene la mayor proporción de empleados en Zhihu, seguida de Alibaba (frecuencia de palabras: 0,004554) y Xiong Factory está ligeramente por detrás.
Se dice que Zhihu es un lugar donde 985/211 vuelan por todo el cielo, entonces, ¿cuál es mejor cuando Qingbei reanude las relaciones diplomáticas con Zhejiang?
Se puede ver que las frecuencias de palabras de la Universidad de Pekín y la Universidad de Tsinghua son aproximadamente las mismas, pero las tres últimas necesitan trabajar más duro.
En la era de la inteligencia móvil, los ingenieros de front-end de Android, iOS y WEB simplemente están brillando en el desarrollo de software actual. Entonces, ¿qué tipo de programador tiene más gente en Zhihu?
El resultado es que la frecuencia de palabras del front-end es mucho mayor que la de Android e iOS. De hecho, la diferencia es solo un poco menor que la suma de Android e iOS. Digámoslo de esta manera, puedes ser un fanático de Apple que cree firmemente en la creencia de Steve Jobs de que menos es más, o puedes ser un fanático de Android que adopta el código abierto, pero todo el mundo necesita navegar por la web, ¿verdad :)? p>
Entonces tengo más curiosidad por saber ¿Cuáles son los intereses y pasatiempos generales de los usuarios?
Resulta que el fitness domina la lista. Parece que Zhihu todavía recomienda en general estar en forma para mejorar la apariencia y aumentar el atractivo.
Pero, ¿por qué la proporción de lectura está en la parte inferior? Por esta razón, sólo puedo suponer que los estudiantes de Zhihu son más eficientes en el aprendizaje y, después de completar las tareas básicas de lectura, se fueron a otros campos para explorar el mundo en general. En otras palabras, la lectura, en comparación con la fotografía de viajes y fitness, no es muy rentable para mejorar el propio valor, por lo que la gente está más inclinada a ir al gimnasio, viajar y tomar fotografías.
Distribución geográfica de usuarios de Zhihu.
La frecuencia de las palabras se concentra en Beijing, Shanghai, Guangzhou, Shenzhen, Hangzhou, Sichuan, Zhejiang, Jiangsu y otros lugares. Es similar a la impresión subjetiva personal. Después de todo, los colores más oscuros de arriba son todas provincias con industrias de Internet relativamente desarrolladas.
Luego está la cuestión de la proporción entre hombres y mujeres en Zhihu que más preocupa a todos.
Entre los datos de usuarios rastreados, los hombres representaron el 67,8% y las mujeres solo el 32,2%. En otras palabras, la proporción entre hombres y mujeres es superior a 2:1.
Al ver esto, puedes refutarme y decir que el género del usuario inicial de Zhihu es masculino. Esto no es suficiente para ser una gran noticia. También pensé que tenía sentido, así que investigué más a los usuarios principales. Las condiciones del filtro eran usuarios con más de 200 fanáticos y más de 400 aprobaciones. Este muestreo debería ser preciso. Luego está la imagen de abajo.
La proporción de mujeres descendió al 30,1% y la de hombres al 69,9%. Este dato está más desequilibrado que los datos anteriores. Por lo tanto, las usuarias son más escasas en Zhihu y parecen ser más valiosas.
Entonces, en lugar de decir que Zhihu es una comunidad de preguntas y respuestas de alta calidad, es mejor decir:
Autor: Peng Jiajin Fuente: Zhihu