entrar registro
  1. fermin
    fermin
    @elpayo Mmmm, la única forma que se me ocurre es hacerlo por los tags (etiquetas), las que se ponen "a mano" cuando se envía una noticia. Así, fíjate que el buscador te permite en los campos seleccionar "tags" (segunda columna llamada "campos" del buscador). Por ejemplo, si quieres buscar todo lo relacionado con "gaza", podrías hacer esta búsqueda:

    www.mediatize.info/search?q=gaza&w=links&p=tags&s=&h=&

    Creo que funciona bastante bien, siempre que se haya etiquetado bien, claro. También se puede buscar por "url" o "title".
    Pero ahora me doy cuenta de que hace siempre una busca que contenga todos los términos, es decir, no hace como google, que si buscas dos palabras, cuando ya no encuentra más entradas que contengan las dos, sigue mostrándote resultados que solo contengan una de las palabras. Creo que si pudiera configurar eso como google quedaría resuelto el problema que planteas.

    También tienes la "nube de tags" o nube de etiquetas, en la página principal a la derecha abajo (pongo captura), donde salen los tags más usados en las últimas horas.

    media
    1    k 20
  1. fermin
    fermin
    @fermin @elpayo Prueba a ver si eso te va bien. Ya me dirás si puedes sacar toda la info que buscas con eso. Lo que propones tú (sistema rígido de "categorización") veo que solo se podría hacer si un humano lo clasificara o mediante algoritmos de clasificación no supervisados. Pero quizás con un nuevo sistema de búsqueda como "elasticsearch" se podría automatizar esta búsqueda en la base de datos. Voy a mentar a @macarty que sé que controla estas cosas para que nos diga si este sistema podría ayudar.

    De todos modos, el sistema de búsqueda del sitio (heredado de menéame) se ha quedado bastante desfasado y tendría que mejorarse claramente. Toda la web en sí, jajaja!! Veremos qué se puede hacer próximamente.

    Como siempre, gracias por las sugerencias!!
    3    k 60
    1. macarty
      macarty
      @fermin @fermin @elpayo elasticsearch puede hacerlo, lo que necestiamos es hacer la ingesta via logstash (supongo que a través de RSS) y grokear las consultas que quieres hacer (que es el coñazo mayúsculo).
      Las dos preguntas aquí son 1) necesitamos histórico? y 2) podemos vivir con un redis pequeñito en caso de que si?
      3    k 60
      1. fermin
        fermin
        @macarty @elpayo Mmm, pero el histórico no está en la DB? Elasticsearch no puede ir a la DB a buscar la info?
        2    k 40
    2. elpayo
      elpayo
      @fermin @fermin @macarty
      la idea era algo a caballo entre la etiqueta y los temas. Que sea la persona que sube la noticia la que elija un tema de los ya existentes o que cree uno nuevo. Que haya una especie de lista donde los temas suben según se le añade una noticia, como los hilos de un foro cuando se contesta. Con lo de grokear me habeis matao ¿Qué coño es eso?
      3    k 60
      1. fermin
        fermin
        @elpayo @macarty Ah, vale, ahora entiendo. Voy a darle una vuelta a ver qué se puede hacer. El problema principal que le veo es que tiene que administrarlo la gente, y siempre hay críticas a la actual categorización. Es decir, que la gente prefiere mandar la noticia y que todo sea automático, como en facebook. Pero si se implemente así, luego la web deja de tener sentido, porque sería más como una red social, donde importa más el "muro" del usuario (que es el protagonista) para cada usuario.
        0    k 0
      2. Cyberloaf
        Cyberloaf
        @fermin @elpayo @macarty KISS: Keep It Simple and Stupid

        Mi critica es a la filosofía aristotélica de categorizar el mundo, y defiendo la productividad de las etiquetas, al no ser exclusivas: puedes tener una noticia en política / economía / mundo / salud...
        2    k 40
      3. fermin
        fermin
        @Cyberloaf @elpayo @macarty El problema de sacar las "categorías" (temas, aquí), es que mediatize se convertiría en facebook, pero el wall sería de todo el mundo y no solo de "tus amigos".

        Y si dejáramos solo las etiquetas (tags), ¿cómo "ordenas" o clasificas? La idea de los temas es tener "sub-sites" que operen sobre un tema ellas solas.
        2    k 40
    3. macarty
      macarty
      @elpayo @fermin @fermin

      Con lo de grokear me habeis matao ¿Qué coño es eso?
      Perdón, a veces hablo y hablo y hablo, y hablo. Es para buscar patrones y expresiones regulares.

      www.elastic.co/guide/en/logstash/current/plugins-filters-grok.html
      2    k 40
      suscripciones por RSS
      ayuda
      +mediatize
      estadísticas
      mediatize
      mediatize