r-min cut

Ejecución

El programa principal corresponde con el fichero src/min_cut.cpp. En él pueden econtrarse las implementaciones de los algoritmos de Karger, KargerStein y la version de Karger con seleccion de aristas por pesos.

Para la ejecución del programa debe utilizarse el siguiente comando:

./min -productos <fichero_prods> -matriz <fichero_matriz> -r <valor_r>

<fichero_prods> : indica el path del fichero donde se guarda la lista de productos y su informacion.
<fichero_matriz> : indica el path del fichero que alamcena la matriz que representa el grafo.
<valor_r> : indica el número de conjuntos r a generar.

Ficheros auxiliares

En el directorio src también pueden encontrarse lo ficheros generar_datos.cpp usado para la generacion de datos, grafo.hpp donde se define la estrutura grafo utilizada, producto.hpp que especifica el tipo de dato producto, random.cpp y random.hpp que continen la libreria de generadores aleatorios utilizada y tabla_hash.hpp donde se define la estrutura tabla hash usada para almacenar los productos.

Ejecutar las pruebas automáticas

Se ha creado un script que se encarga de ejecutar pruebas de manera automática, se puede ejecutar de la siguiente forma:

./ejecutar_pruebas.sh

Generación de datos de prueba

Los datos de prueba (directorio pruebas) se han generado de manera aleatoria en C++. Como generador pseudo-aleatorio, se ha utilizando el algoritmo Mersenne Twister con 19937 bits (std::mt19937). El generador se ha inicializado con una semilla producida por un generador de números aleatorios no determinista (std::random_device).

Se han generado n instancias, en las que se ha ido variando el número de productos y la probabilidad de que dos productos cualesquiera hayan sido comprados juntos alguna vez.

Al aumentar el número de productos, aumenta el número de vértices del grafo, y conforme aumenta la probabilidad, aumenta el número de aristas (el grafo es más denso). El máximo número de aristas que puede tener un grafo con k vértices es k * (k - 1) / 2.

Nombres de los ficheros

Por cada instancia del problema hay dos ficheros, uno contiene los productos y otro, la matriz de adyacencia. Sus nombres tienen el siguiente formato:

productos_<num_prods>_<prob>_<instancia>.txt

matriz_<num_prods>_<prob>_<instancia>.txt

El valor <num_prods> indica el número de productos que contiene la instancia, <prob> es la probabilidad de que dos productos aparezcan conectados en la matriz de adyacencia e <instancia> es el número de la instancia generada con los parámetros anteriores.

Formato de los ficheros

El fichero de productos contiene <num_prods> líneas con el siguiente formato:

<ID_producto> <cantidad> <precio>
...

El valor <ID_producto> contiene una cadena aleatoria de entre 1 y 20 caracteres, que puede servir para identificar el producto. <cantidad> es el número de unidades disponibles del producto (entre 1 y 1000), y <precio> es un valor real con dos cifras de precisión que representa su precio (entre 0.01 y 9999).

El fichero de la matriz de adyacencia contiene los siguientes datos:

<num_prods>
<matriz_adyacencia>

La matriz de adyacencia es una matriz booleanos, simétrica y de dimensión <num_prods>x<num_prods>. Los valores de las columnas aparecen separados por espacios y las filas, por saltos de línea. Cada posición (i, j) de la matriz contiene el carácter 1 si los productos i y j han sido comprados juntos alguna vez, y 0 en el caso contrario.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

r-min cut

Ejecución

Ficheros auxiliares

Ejecutar las pruebas automáticas

Generación de datos de prueba

Nombres de los ficheros

Formato de los ficheros

Files

README.md

Latest commit

History

README.md

File metadata and controls

r-min cut

Ejecución

Ficheros auxiliares

Ejecutar las pruebas automáticas

Generación de datos de prueba

Nombres de los ficheros

Formato de los ficheros