]> sigrok.org Git - libsigrok.git/blobdiff - src/hardware/asix-sigma/protocol.c
asix-sigma: reword list of sample rates, (try to) use 1/2/5 steps
[libsigrok.git] / src / hardware / asix-sigma / protocol.c
index 5fa7b2d015a1080d442e8b12ec162131e9f00eff..80e60706085fd110bf75befda024ae5b46180118 100644 (file)
 #include <config.h>
 #include "protocol.h"
 
-#define USB_VENDOR                     0xa600
-#define USB_PRODUCT                    0xa000
-#define USB_DESCRIPTION                        "ASIX SIGMA"
-#define USB_VENDOR_NAME                        "ASIX"
-#define USB_MODEL_NAME                 "SIGMA"
-
 /*
- * The ASIX Sigma supports arbitrary integer frequency divider in
- * the 50MHz mode. The divider is in range 1...256 , allowing for
- * very precise sampling rate selection. This driver supports only
- * a subset of the sampling rates.
+ * The ASIX SIGMA hardware supports fixed 200MHz and 100MHz sample rates
+ * (by means of separate firmware images). As well as 50MHz divided by
+ * an integer divider in the 1..256 range (by the "typical" firmware).
+ * Which translates to a strict lower boundary of around 195kHz.
+ *
+ * This driver "suggests" a subset of the available rates by listing a
+ * few discrete values, while setter routines accept any user specified
+ * rate that is supported by the hardware.
  */
 SR_PRIV const uint64_t samplerates[] = {
-       SR_KHZ(200),    /* div=250 */
-       SR_KHZ(250),    /* div=200 */
-       SR_KHZ(500),    /* div=100 */
-       SR_MHZ(1),      /* div=50  */
-       SR_MHZ(5),      /* div=10  */
-       SR_MHZ(10),     /* div=5   */
-       SR_MHZ(25),     /* div=2   */
-       SR_MHZ(50),     /* div=1   */
-       SR_MHZ(100),    /* Special FW needed */
-       SR_MHZ(200),    /* Special FW needed */
+       /* 50MHz and integer divider. 1/2/5 steps (where possible). */
+       SR_KHZ(200), SR_KHZ(500),
+       SR_MHZ(1), SR_MHZ(2), SR_MHZ(5),
+       SR_MHZ(10), SR_MHZ(25), SR_MHZ(50),
+       /* 100MHz/200MHz, fixed rates in special firmware. */
+       SR_MHZ(100), SR_MHZ(200),
 };
 
-SR_PRIV const int SAMPLERATES_COUNT = ARRAY_SIZE(samplerates);
-
-static const char sigma_firmware_files[][24] = {
-       /* 50 MHz, supports 8 bit fractions */
-       "asix-sigma-50.fw",
-       /* 100 MHz */
-       "asix-sigma-100.fw",
-       /* 200 MHz */
-       "asix-sigma-200.fw",
-       /* Synchronous clock from pin */
-       "asix-sigma-50sync.fw",
-       /* Frequency counter */
-       "asix-sigma-phasor.fw",
+SR_PRIV const size_t samplerates_count = ARRAY_SIZE(samplerates);
+
+static const char *firmware_files[] = {
+       [SIGMA_FW_50MHZ] = "asix-sigma-50.fw", /* 50MHz, 8bit divider. */
+       [SIGMA_FW_100MHZ] = "asix-sigma-100.fw", /* 100MHz, fixed. */
+       [SIGMA_FW_200MHZ] = "asix-sigma-200.fw", /* 200MHz, fixed. */
+       [SIGMA_FW_SYNC] = "asix-sigma-50sync.fw", /* Sync from external pin. */
+       [SIGMA_FW_FREQ] = "asix-sigma-phasor.fw", /* Frequency counter. */
 };
 
+#define SIGMA_FIRMWARE_SIZE_LIMIT (256 * 1024)
+
 static int sigma_read(void *buf, size_t size, struct dev_context *devc)
 {
        int ret;
@@ -84,12 +75,11 @@ static int sigma_write(void *buf, size_t size, struct dev_context *devc)
        int ret;
 
        ret = ftdi_write_data(&devc->ftdic, (unsigned char *)buf, size);
-       if (ret < 0) {
+       if (ret < 0)
                sr_err("ftdi_write_data failed: %s",
                       ftdi_get_error_string(&devc->ftdic));
-       } else if ((size_t) ret != size) {
+       else if ((size_t) ret != size)
                sr_err("ftdi_write_data did not complete write.");
-       }
 
        return ret;
 }
@@ -105,9 +95,9 @@ SR_PRIV int sigma_write_register(uint8_t reg, uint8_t *data, size_t len,
        uint8_t buf[80];
        int idx = 0;
 
-       if ((len + 2) > sizeof(buf)) {
+       if ((2 * len + 2) > sizeof(buf)) {
                sr_err("Attempted to write %zu bytes, but buffer is too small.",
-                      len + 2);
+                      len);
                return SR_ERR_BUG;
        }
 
@@ -141,30 +131,21 @@ static int sigma_read_register(uint8_t reg, uint8_t *data, size_t len,
        return sigma_read(data, len, devc);
 }
 
-static uint8_t sigma_get_register(uint8_t reg, struct dev_context *devc)
-{
-       uint8_t value;
-
-       if (1 != sigma_read_register(reg, &value, 1, devc)) {
-               sr_err("sigma_get_register: 1 byte expected");
-               return 0;
-       }
-
-       return value;
-}
-
 static int sigma_read_pos(uint32_t *stoppos, uint32_t *triggerpos,
                          struct dev_context *devc)
 {
+       /*
+        * Read 6 registers starting at trigger position LSB.
+        * Which yields two 24bit counter values.
+        */
        uint8_t buf[] = {
                REG_ADDR_LOW | READ_TRIGGER_POS_LOW,
-
-               REG_READ_ADDR | NEXT_REG,
-               REG_READ_ADDR | NEXT_REG,
-               REG_READ_ADDR | NEXT_REG,
-               REG_READ_ADDR | NEXT_REG,
-               REG_READ_ADDR | NEXT_REG,
-               REG_READ_ADDR | NEXT_REG,
+               REG_READ_ADDR | REG_ADDR_INC,
+               REG_READ_ADDR | REG_ADDR_INC,
+               REG_READ_ADDR | REG_ADDR_INC,
+               REG_READ_ADDR | REG_ADDR_INC,
+               REG_READ_ADDR | REG_ADDR_INC,
+               REG_READ_ADDR | REG_ADDR_INC,
        };
        uint8_t result[6];
 
@@ -175,11 +156,25 @@ static int sigma_read_pos(uint32_t *stoppos, uint32_t *triggerpos,
        *triggerpos = result[0] | (result[1] << 8) | (result[2] << 16);
        *stoppos = result[3] | (result[4] << 8) | (result[5] << 16);
 
-       /* Not really sure why this must be done, but according to spec. */
+       /*
+        * These "position" values point to after the event (end of
+        * capture data, trigger condition matched). This is why they
+        * get decremented here. Sample memory consists of 512-byte
+        * chunks with meta data in the upper 64 bytes. Thus when the
+        * decrements takes us into this upper part of the chunk, then
+        * further move backwards to the end of the chunk's data part.
+        *
+        * TODO Re-consider the above comment's validity. It's true
+        * that a 1024byte row contains 512 u16 entities, of which 64
+        * are timestamps and 448 are events with sample data. It's not
+        * true that 64bytes of metadata reside at the top of a 512byte
+        * block in a row.
+        *
+        * TODO Use ROW_MASK and CLUSTERS_PER_ROW here?
+        */
        if ((--*stoppos & 0x1ff) == 0x1ff)
                *stoppos -= 64;
-
-       if ((*--triggerpos & 0x1ff) == 0x1ff)
+       if ((--*triggerpos & 0x1ff) == 0x1ff)
                *triggerpos -= 64;
 
        return 1;
@@ -188,33 +183,38 @@ static int sigma_read_pos(uint32_t *stoppos, uint32_t *triggerpos,
 static int sigma_read_dram(uint16_t startchunk, size_t numchunks,
                           uint8_t *data, struct dev_context *devc)
 {
-       size_t i;
        uint8_t buf[4096];
-       int idx = 0;
+       int idx;
+       size_t chunk;
+       int sel;
+       gboolean is_last;
 
-       /* Send the startchunk. Index start with 1. */
-       buf[0] = startchunk >> 8;
-       buf[1] = startchunk & 0xff;
-       sigma_write_register(WRITE_MEMROW, buf, 2, devc);
+       /* Communicate DRAM start address (memory row, aka samples line). */
+       idx = 0;
+       buf[idx++] = startchunk >> 8;
+       buf[idx++] = startchunk & 0xff;
+       sigma_write_register(WRITE_MEMROW, buf, idx, devc);
 
-       /* Read the DRAM. */
+       /*
+        * Access DRAM content. Fetch from DRAM to FPGA's internal RAM,
+        * then transfer via USB. Interleave the FPGA's DRAM access and
+        * USB transfer, use alternating buffers (0/1) in the process.
+        */
+       idx = 0;
        buf[idx++] = REG_DRAM_BLOCK;
        buf[idx++] = REG_DRAM_WAIT_ACK;
-
-       for (i = 0; i < numchunks; i++) {
-               /* Alternate bit to copy from DRAM to cache. */
-               if (i != (numchunks - 1))
-                       buf[idx++] = REG_DRAM_BLOCK | (((i + 1) % 2) << 4);
-
-               buf[idx++] = REG_DRAM_BLOCK_DATA | ((i % 2) << 4);
-
-               if (i != (numchunks - 1))
+       for (chunk = 0; chunk < numchunks; chunk++) {
+               sel = chunk % 2;
+               is_last = chunk == numchunks - 1;
+               if (!is_last)
+                       buf[idx++] = REG_DRAM_BLOCK | REG_DRAM_SEL_BOOL(!sel);
+               buf[idx++] = REG_DRAM_BLOCK_DATA | REG_DRAM_SEL_BOOL(sel);
+               if (!is_last)
                        buf[idx++] = REG_DRAM_WAIT_ACK;
        }
-
        sigma_write(buf, idx, devc);
 
-       return sigma_read(data, numchunks * CHUNK_SIZE, devc);
+       return sigma_read(data, numchunks * ROW_LENGTH_BYTES, devc);
 }
 
 /* Upload trigger look-up tables to Sigma. */
@@ -264,43 +264,89 @@ SR_PRIV int sigma_write_trigger_lut(struct triggerlut *lut, struct dev_context *
                if (lut->m1d[3] & bit)
                        tmp[1] |= 0x80;
 
-               sigma_write_register(WRITE_TRIGGER_SELECT0, tmp, sizeof(tmp),
+               sigma_write_register(WRITE_TRIGGER_SELECT, tmp, sizeof(tmp),
                                     devc);
-               sigma_set_register(WRITE_TRIGGER_SELECT1, 0x30 | i, devc);
+               sigma_set_register(WRITE_TRIGGER_SELECT2, 0x30 | i, devc);
        }
 
        /* Send the parameters */
-       sigma_write_register(WRITE_TRIGGER_SELECT0, (uint8_t *) &lut->params,
+       sigma_write_register(WRITE_TRIGGER_SELECT, (uint8_t *) &lut->params,
                             sizeof(lut->params), devc);
 
        return SR_OK;
 }
 
-SR_PRIV void sigma_clear_helper(void *priv)
-{
-       struct dev_context *devc;
-
-       devc = priv;
-
-       ftdi_deinit(&devc->ftdic);
-}
+/*
+ * See Xilinx UG332 for Spartan-3 FPGA configuration. The SIGMA device
+ * uses FTDI bitbang mode for netlist download in slave serial mode.
+ * (LATER: The OMEGA device's cable contains a more capable FTDI chip
+ * and uses MPSSE mode for bitbang. -- Can we also use FT232H in FT245
+ * compatible bitbang mode? For maximum code re-use and reduced libftdi
+ * dependency? See section 3.5.5 of FT232H: D0 clk, D1 data (out), D2
+ * data (in), D3 select, D4-7 GPIOL. See section 3.5.7 for MCU FIFO.)
+ *
+ * 750kbps rate (four times the speed of sigmalogan) works well for
+ * netlist download. All pins except INIT_B are output pins during
+ * configuration download.
+ *
+ * Some pins are inverted as a byproduct of level shifting circuitry.
+ * That's why high CCLK level (from the cable's point of view) is idle
+ * from the FPGA's perspective.
+ *
+ * The vendor's literature discusses a "suicide sequence" which ends
+ * regular FPGA execution and should be sent before entering bitbang
+ * mode and sending configuration data. Set D7 and toggle D2, D3, D4
+ * a few times.
+ */
+#define BB_PIN_CCLK (1 << 0) /* D0, CCLK */
+#define BB_PIN_PROG (1 << 1) /* D1, PROG */
+#define BB_PIN_D2   (1 << 2) /* D2, (part of) SUICIDE */
+#define BB_PIN_D3   (1 << 3) /* D3, (part of) SUICIDE */
+#define BB_PIN_D4   (1 << 4) /* D4, (part of) SUICIDE (unused?) */
+#define BB_PIN_INIT (1 << 5) /* D5, INIT, input pin */
+#define BB_PIN_DIN  (1 << 6) /* D6, DIN */
+#define BB_PIN_D7   (1 << 7) /* D7, (part of) SUICIDE */
+
+#define BB_BITRATE (750 * 1000)
+#define BB_PINMASK (0xff & ~BB_PIN_INIT)
 
 /*
- * Configure the FPGA for bitbang mode.
- * This sequence is documented in section 2. of the ASIX Sigma programming
- * manual. This sequence is necessary to configure the FPGA in the Sigma
- * into Bitbang mode, in which it can be programmed with the firmware.
+ * Initiate slave serial mode for configuration download. Which is done
+ * by pulsing PROG_B and sensing INIT_B. Make sure CCLK is idle before
+ * initiating the configuration download.
+ *
+ * Run a "suicide sequence" first to terminate the regular FPGA operation
+ * before reconfiguration. The FTDI cable is single channel, and shares
+ * pins which are used for data communication in FIFO mode with pins that
+ * are used for FPGA configuration in bitbang mode. Hardware defaults for
+ * unconfigured hardware, and runtime conditions after FPGA configuration
+ * need to cooperate such that re-configuration of the FPGA can start.
  */
-static int sigma_fpga_init_bitbang(struct dev_context *devc)
+static int sigma_fpga_init_bitbang_once(struct dev_context *devc)
 {
        uint8_t suicide[] = {
-               0x84, 0x84, 0x88, 0x84, 0x88, 0x84, 0x88, 0x84,
+               BB_PIN_D7 | BB_PIN_D2,
+               BB_PIN_D7 | BB_PIN_D2,
+               BB_PIN_D7 |           BB_PIN_D3,
+               BB_PIN_D7 | BB_PIN_D2,
+               BB_PIN_D7 |           BB_PIN_D3,
+               BB_PIN_D7 | BB_PIN_D2,
+               BB_PIN_D7 |           BB_PIN_D3,
+               BB_PIN_D7 | BB_PIN_D2,
        };
        uint8_t init_array[] = {
-               0x01, 0x03, 0x03, 0x01, 0x01, 0x01, 0x01, 0x01,
-               0x01, 0x01,
+               BB_PIN_CCLK,
+               BB_PIN_CCLK | BB_PIN_PROG,
+               BB_PIN_CCLK | BB_PIN_PROG,
+               BB_PIN_CCLK,
+               BB_PIN_CCLK,
+               BB_PIN_CCLK,
+               BB_PIN_CCLK,
+               BB_PIN_CCLK,
+               BB_PIN_CCLK,
+               BB_PIN_CCLK,
        };
-       int i, ret, timeout = (10 * 1000);
+       int retries, ret;
        uint8_t data;
 
        /* Section 2. part 1), do the FPGA suicide. */
@@ -308,66 +354,96 @@ static int sigma_fpga_init_bitbang(struct dev_context *devc)
        sigma_write(suicide, sizeof(suicide), devc);
        sigma_write(suicide, sizeof(suicide), devc);
        sigma_write(suicide, sizeof(suicide), devc);
+       g_usleep(10 * 1000);
 
-       /* Section 2. part 2), do pulse on D1. */
+       /* Section 2. part 2), pulse PROG. */
        sigma_write(init_array, sizeof(init_array), devc);
+       g_usleep(10 * 1000);
        ftdi_usb_purge_buffers(&devc->ftdic);
 
-       /* Wait until the FPGA asserts D6/INIT_B. */
-       for (i = 0; i < timeout; i++) {
+       /* Wait until the FPGA asserts INIT_B. */
+       retries = 10;
+       while (retries--) {
                ret = sigma_read(&data, 1, devc);
                if (ret < 0)
                        return ret;
-               /* Test if pin D6 got asserted. */
-               if (data & (1 << 5))
-                       return 0;
-               /* The D6 was not asserted yet, wait a bit. */
+               if (data & BB_PIN_INIT)
+                       return SR_OK;
                g_usleep(10 * 1000);
        }
 
        return SR_ERR_TIMEOUT;
 }
 
+/*
+ * This is belt and braces. Re-run the bitbang initiation sequence a few
+ * times should first attempts fail. Failure is rare but can happen (was
+ * observed during driver development).
+ */
+static int sigma_fpga_init_bitbang(struct dev_context *devc)
+{
+       size_t retries;
+       int ret;
+
+       retries = 10;
+       while (retries--) {
+               ret = sigma_fpga_init_bitbang_once(devc);
+               if (ret == SR_OK)
+                       return ret;
+               if (ret != SR_ERR_TIMEOUT)
+                       return ret;
+       }
+       return ret;
+}
+
 /*
  * Configure the FPGA for logic-analyzer mode.
  */
 static int sigma_fpga_init_la(struct dev_context *devc)
 {
-       /* Initialize the logic analyzer mode. */
+       /*
+        * TODO Construct the sequence at runtime? Such that request data
+        * and response check values will match more apparently?
+        */
+       uint8_t mode_regval = WMR_SDRAMINIT;
        uint8_t logic_mode_start[] = {
+               /* Read ID register. */
                REG_ADDR_LOW  | (READ_ID & 0xf),
-               REG_ADDR_HIGH | (READ_ID >> 8),
-               REG_READ_ADDR,  /* Read ID register. */
+               REG_ADDR_HIGH | (READ_ID >> 4),
+               REG_READ_ADDR,
 
+               /* Write 0x55 to scratch register, read back. */
                REG_ADDR_LOW | (WRITE_TEST & 0xf),
                REG_DATA_LOW | 0x5,
                REG_DATA_HIGH_WRITE | 0x5,
-               REG_READ_ADDR,  /* Read scratch register. */
+               REG_READ_ADDR,
 
+               /* Write 0xaa to scratch register, read back. */
                REG_DATA_LOW | 0xa,
                REG_DATA_HIGH_WRITE | 0xa,
-               REG_READ_ADDR,  /* Read scratch register. */
+               REG_READ_ADDR,
 
+               /* Initiate SDRAM initialization in mode register. */
                REG_ADDR_LOW | (WRITE_MODE & 0xf),
-               REG_DATA_LOW | 0x0,
-               REG_DATA_HIGH_WRITE | 0x8,
+               REG_DATA_LOW | (mode_regval & 0xf),
+               REG_DATA_HIGH_WRITE | (mode_regval >> 4),
        };
-
        uint8_t result[3];
        int ret;
 
-       /* Initialize the logic analyzer mode. */
+       /*
+        * Send the command sequence which contains 3 READ requests.
+        * Expect to see the corresponding 3 response bytes.
+        */
        sigma_write(logic_mode_start, sizeof(logic_mode_start), devc);
-
-       /* Expect a 3 byte reply since we issued three READ requests. */
-       ret = sigma_read(result, 3, devc);
-       if (ret != 3)
+       ret = sigma_read(result, ARRAY_SIZE(result), devc);
+       if (ret != ARRAY_SIZE(result))
                goto err;
-
        if (result[0] != 0xa6 || result[1] != 0x55 || result[2] != 0xaa)
                goto err;
 
        return SR_OK;
+
 err:
        sr_err("Configuration failed. Invalid reply received.");
        return SR_ERR;
@@ -381,99 +457,117 @@ err:
 static int sigma_fw_2_bitbang(struct sr_context *ctx, const char *name,
                              uint8_t **bb_cmd, gsize *bb_cmd_size)
 {
-       size_t i, file_size, bb_size;
-       char *firmware;
-       uint8_t *bb_stream, *bbs;
+       uint8_t *firmware;
+       size_t file_size;
+       uint8_t *p;
+       size_t l;
        uint32_t imm;
-       int bit, v;
-       int ret = SR_OK;
+       size_t bb_size;
+       uint8_t *bb_stream, *bbs, byte, mask, v;
 
-       firmware = sr_resource_load(ctx, SR_RESOURCE_FIRMWARE,
-                       name, &file_size, 256 * 1024);
+       /* Retrieve the on-disk firmware file content. */
+       firmware = sr_resource_load(ctx, SR_RESOURCE_FIRMWARE, name,
+               &file_size, SIGMA_FIRMWARE_SIZE_LIMIT);
        if (!firmware)
-               return SR_ERR;
+               return SR_ERR_IO;
 
-       /* Weird magic transformation below, I have no idea what it does. */
+       /* Unscramble the file content (XOR with "random" sequence). */
+       p = firmware;
+       l = file_size;
        imm = 0x3f6df2ab;
-       for (i = 0; i < file_size; i++) {
+       while (l--) {
                imm = (imm + 0xa853753) % 177 + (imm * 0x8034052);
-               firmware[i] ^= imm & 0xff;
+               *p++ ^= imm & 0xff;
        }
 
        /*
-        * Now that the firmware is "transformed", we will transcribe the
-        * firmware blob into a sequence of toggles of the Dx wires. This
-        * sequence will be fed directly into the Sigma, which must be in
-        * the FPGA bitbang programming mode.
+        * Generate a sequence of bitbang samples. With two samples per
+        * FPGA configuration bit, providing the level for the DIN signal
+        * as well as two edges for CCLK. See Xilinx UG332 for details
+        * ("slave serial" mode).
+        *
+        * Note that CCLK is inverted in hardware. That's why the
+        * respective bit is first set and then cleared in the bitbang
+        * sample sets. So that the DIN level will be stable when the
+        * data gets sampled at the rising CCLK edge, and the signals'
+        * setup time constraint will be met.
+        *
+        * The caller will put the FPGA into download mode, will send
+        * the bitbang samples, and release the allocated memory.
         */
-
-       /* Each bit of firmware is transcribed as two toggles of Dx wires. */
        bb_size = file_size * 8 * 2;
-       bb_stream = (uint8_t *)g_try_malloc(bb_size);
+       bb_stream = g_try_malloc(bb_size);
        if (!bb_stream) {
                sr_err("%s: Failed to allocate bitbang stream", __func__);
-               ret = SR_ERR_MALLOC;
-               goto exit;
+               g_free(firmware);
+               return SR_ERR_MALLOC;
        }
-
        bbs = bb_stream;
-       for (i = 0; i < file_size; i++) {
-               for (bit = 7; bit >= 0; bit--) {
-                       v = (firmware[i] & (1 << bit)) ? 0x40 : 0x00;
-                       *bbs++ = v | 0x01;
+       p = firmware;
+       l = file_size;
+       while (l--) {
+               byte = *p++;
+               mask = 0x80;
+               while (mask) {
+                       v = (byte & mask) ? BB_PIN_DIN : 0;
+                       mask >>= 1;
+                       *bbs++ = v | BB_PIN_CCLK;
                        *bbs++ = v;
                }
        }
+       g_free(firmware);
 
        /* The transformation completed successfully, return the result. */
        *bb_cmd = bb_stream;
        *bb_cmd_size = bb_size;
 
-exit:
-       g_free(firmware);
-       return ret;
+       return SR_OK;
 }
 
 static int upload_firmware(struct sr_context *ctx,
-               int firmware_idx, struct dev_context *devc)
+       struct dev_context *devc, enum sigma_firmware_idx firmware_idx)
 {
        int ret;
        unsigned char *buf;
        unsigned char pins;
        size_t buf_size;
-       const char *firmware = sigma_firmware_files[firmware_idx];
-       struct ftdi_context *ftdic = &devc->ftdic;
-
-       /* Make sure it's an ASIX SIGMA. */
-       ret = ftdi_usb_open_desc(ftdic, USB_VENDOR, USB_PRODUCT,
-                                USB_DESCRIPTION, NULL);
-       if (ret < 0) {
-               sr_err("ftdi_usb_open failed: %s",
-                      ftdi_get_error_string(ftdic));
-               return 0;
+       const char *firmware;
+
+       /* Check for valid firmware file selection. */
+       if (firmware_idx >= ARRAY_SIZE(firmware_files))
+               return SR_ERR_ARG;
+       firmware = firmware_files[firmware_idx];
+       if (!firmware || !*firmware)
+               return SR_ERR_ARG;
+
+       /* Avoid downloading the same firmware multiple times. */
+       if (devc->firmware_idx == firmware_idx) {
+               sr_info("Not uploading firmware file '%s' again.", firmware);
+               return SR_OK;
        }
 
-       ret = ftdi_set_bitmode(ftdic, 0xdf, BITMODE_BITBANG);
+       devc->state.state = SIGMA_CONFIG;
+
+       /* Set the cable to bitbang mode. */
+       ret = ftdi_set_bitmode(&devc->ftdic, BB_PINMASK, BITMODE_BITBANG);
        if (ret < 0) {
                sr_err("ftdi_set_bitmode failed: %s",
-                      ftdi_get_error_string(ftdic));
-               return 0;
+                      ftdi_get_error_string(&devc->ftdic));
+               return SR_ERR;
        }
-
-       /* Four times the speed of sigmalogan - Works well. */
-       ret = ftdi_set_baudrate(ftdic, 750 * 1000);
+       ret = ftdi_set_baudrate(&devc->ftdic, BB_BITRATE);
        if (ret < 0) {
                sr_err("ftdi_set_baudrate failed: %s",
-                      ftdi_get_error_string(ftdic));
-               return 0;
+                      ftdi_get_error_string(&devc->ftdic));
+               return SR_ERR;
        }
 
-       /* Initialize the FPGA for firmware upload. */
+       /* Initiate FPGA configuration mode. */
        ret = sigma_fpga_init_bitbang(devc);
        if (ret)
                return ret;
 
-       /* Prepare firmware. */
+       /* Prepare wire format of the firmware image. */
        ret = sigma_fw_2_bitbang(ctx, firmware, &buf, &buf_size);
        if (ret != SR_OK) {
                sr_err("An error occurred while reading the firmware: %s",
@@ -481,22 +575,20 @@ static int upload_firmware(struct sr_context *ctx,
                return ret;
        }
 
-       /* Upload firmware. */
+       /* Write the FPGA netlist to the cable. */
        sr_info("Uploading firmware file '%s'.", firmware);
        sigma_write(buf, buf_size, devc);
 
        g_free(buf);
 
-       ret = ftdi_set_bitmode(ftdic, 0x00, BITMODE_RESET);
+       /* Leave bitbang mode and discard pending input data. */
+       ret = ftdi_set_bitmode(&devc->ftdic, 0, BITMODE_RESET);
        if (ret < 0) {
                sr_err("ftdi_set_bitmode failed: %s",
-                      ftdi_get_error_string(ftdic));
+                      ftdi_get_error_string(&devc->ftdic));
                return SR_ERR;
        }
-
-       ftdi_usb_purge_buffers(ftdic);
-
-       /* Discard garbage. */
+       ftdi_usb_purge_buffers(&devc->ftdic);
        while (sigma_read(&pins, 1, devc) == 1)
                ;
 
@@ -505,52 +597,331 @@ static int upload_firmware(struct sr_context *ctx,
        if (ret != SR_OK)
                return ret;
 
-       devc->cur_firmware = firmware_idx;
-
+       /* Keep track of successful firmware download completion. */
+       devc->state.state = SIGMA_IDLE;
+       devc->firmware_idx = firmware_idx;
        sr_info("Firmware uploaded.");
 
        return SR_OK;
 }
 
-SR_PRIV int sigma_set_samplerate(const struct sr_dev_inst *sdi, uint64_t samplerate)
+/*
+ * The driver supports user specified time or sample count limits. The
+ * device's hardware supports neither, and hardware compression prevents
+ * reliable detection of "fill levels" (currently reached sample counts)
+ * from register values during acquisition. That's why the driver needs
+ * to apply some heuristics:
+ *
+ * - The (optional) sample count limit and the (normalized) samplerate
+ *   get mapped to an estimated duration for these samples' acquisition.
+ * - The (optional) time limit gets checked as well. The lesser of the
+ *   two limits will terminate the data acquisition phase. The exact
+ *   sample count limit gets enforced in session feed submission paths.
+ * - Some slack needs to be given to account for hardware pipelines as
+ *   well as late storage of last chunks after compression thresholds
+ *   are tripped. The resulting data set will span at least the caller
+ *   specified period of time, which shall be perfectly acceptable.
+ *
+ * With RLE compression active, up to 64K sample periods can pass before
+ * a cluster accumulates. Which translates to 327ms at 200kHz. Add two
+ * times that period for good measure, one is not enough to flush the
+ * hardware pipeline (observation from an earlier experiment).
+ */
+SR_PRIV int sigma_set_acquire_timeout(struct dev_context *devc)
+{
+       int ret;
+       GVariant *data;
+       uint64_t user_count, user_msecs;
+       uint64_t worst_cluster_time_ms;
+       uint64_t count_msecs, acquire_msecs;
+
+       sr_sw_limits_init(&devc->acq_limits);
+
+       /* Get sample count limit, convert to msecs. */
+       ret = sr_sw_limits_config_get(&devc->cfg_limits,
+               SR_CONF_LIMIT_SAMPLES, &data);
+       if (ret != SR_OK)
+               return ret;
+       user_count = g_variant_get_uint64(data);
+       g_variant_unref(data);
+       count_msecs = 0;
+       if (user_count)
+               count_msecs = 1000 * user_count / devc->samplerate + 1;
+
+       /* Get time limit, which is in msecs. */
+       ret = sr_sw_limits_config_get(&devc->cfg_limits,
+               SR_CONF_LIMIT_MSEC, &data);
+       if (ret != SR_OK)
+               return ret;
+       user_msecs = g_variant_get_uint64(data);
+       g_variant_unref(data);
+
+       /* Get the lesser of them, with both being optional. */
+       acquire_msecs = ~0ull;
+       if (user_count && count_msecs < acquire_msecs)
+               acquire_msecs = count_msecs;
+       if (user_msecs && user_msecs < acquire_msecs)
+               acquire_msecs = user_msecs;
+       if (acquire_msecs == ~0ull)
+               return SR_OK;
+
+       /* Add some slack, and use that timeout for acquisition. */
+       worst_cluster_time_ms = 1000 * 65536 / devc->samplerate;
+       acquire_msecs += 2 * worst_cluster_time_ms;
+       data = g_variant_new_uint64(acquire_msecs);
+       ret = sr_sw_limits_config_set(&devc->acq_limits,
+               SR_CONF_LIMIT_MSEC, data);
+       g_variant_unref(data);
+       if (ret != SR_OK)
+               return ret;
+
+       sr_sw_limits_acquisition_start(&devc->acq_limits);
+       return SR_OK;
+}
+
+/*
+ * Check whether a caller specified samplerate matches the device's
+ * hardware constraints (can be used for acquisition). Optionally yield
+ * a value that approximates the original spec.
+ *
+ * This routine assumes that input specs are in the 200kHz to 200MHz
+ * range of supported rates, and callers typically want to normalize a
+ * given value to the hardware capabilities. Values in the 50MHz range
+ * get rounded up by default, to avoid a more expensive check for the
+ * closest match, while higher sampling rate is always desirable during
+ * measurement. Input specs which exactly match hardware capabilities
+ * remain unaffected. Because 100/200MHz rates also limit the number of
+ * available channels, they are not suggested by this routine, instead
+ * callers need to pick them consciously.
+ */
+SR_PRIV int sigma_normalize_samplerate(uint64_t want_rate, uint64_t *have_rate)
+{
+       uint64_t div, rate;
+
+       /* Accept exact matches for 100/200MHz. */
+       if (want_rate == SR_MHZ(200) || want_rate == SR_MHZ(100)) {
+               if (have_rate)
+                       *have_rate = want_rate;
+               return SR_OK;
+       }
+
+       /* Accept 200kHz to 50MHz range, and map to near value. */
+       if (want_rate >= SR_KHZ(200) && want_rate <= SR_MHZ(50)) {
+               div = SR_MHZ(50) / want_rate;
+               rate = SR_MHZ(50) / div;
+               if (have_rate)
+                       *have_rate = rate;
+               return SR_OK;
+       }
+
+       return SR_ERR_ARG;
+}
+
+SR_PRIV int sigma_set_samplerate(const struct sr_dev_inst *sdi)
 {
        struct dev_context *devc;
        struct drv_context *drvc;
-       unsigned int i;
+       uint64_t samplerate;
        int ret;
+       int num_channels;
 
        devc = sdi->priv;
        drvc = sdi->driver->context;
-       ret = SR_OK;
 
-       for (i = 0; i < ARRAY_SIZE(samplerates); i++) {
-               if (samplerates[i] == samplerate)
-                       break;
-       }
-       if (samplerates[i] == 0)
-               return SR_ERR_SAMPLERATE;
+       /* Accept any caller specified rate which the hardware supports. */
+       ret = sigma_normalize_samplerate(devc->samplerate, &samplerate);
+       if (ret != SR_OK)
+               return ret;
 
+       /*
+        * Depending on the samplerates of 200/100/50- MHz, specific
+        * firmware is required and higher rates might limit the set
+        * of available channels.
+        */
+       num_channels = devc->num_channels;
        if (samplerate <= SR_MHZ(50)) {
-               ret = upload_firmware(drvc->sr_ctx, 0, devc);
-               devc->num_channels = 16;
+               ret = upload_firmware(drvc->sr_ctx, devc, SIGMA_FW_50MHZ);
+               num_channels = 16;
        } else if (samplerate == SR_MHZ(100)) {
-               ret = upload_firmware(drvc->sr_ctx, 1, devc);
-               devc->num_channels = 8;
+               ret = upload_firmware(drvc->sr_ctx, devc, SIGMA_FW_100MHZ);
+               num_channels = 8;
        } else if (samplerate == SR_MHZ(200)) {
-               ret = upload_firmware(drvc->sr_ctx, 2, devc);
-               devc->num_channels = 4;
+               ret = upload_firmware(drvc->sr_ctx, devc, SIGMA_FW_200MHZ);
+               num_channels = 4;
        }
 
+       /*
+        * The samplerate affects the number of available logic channels
+        * as well as a sample memory layout detail (the number of samples
+        * which the device will communicate within an "event").
+        */
        if (ret == SR_OK) {
-               devc->cur_samplerate = samplerate;
-               devc->period_ps = 1000000000000ULL / samplerate;
+               devc->num_channels = num_channels;
                devc->samples_per_event = 16 / devc->num_channels;
-               devc->state.state = SIGMA_IDLE;
        }
 
        return ret;
 }
 
+/*
+ * Arrange for a session feed submit buffer. A queue where a number of
+ * samples gets accumulated to reduce the number of send calls. Which
+ * also enforces an optional sample count limit for data acquisition.
+ *
+ * The buffer holds up to CHUNK_SIZE bytes. The unit size is fixed (the
+ * driver provides a fixed channel layout regardless of samplerate).
+ */
+
+#define CHUNK_SIZE     (4 * 1024 * 1024)
+
+struct submit_buffer {
+       size_t unit_size;
+       size_t max_samples, curr_samples;
+       uint8_t *sample_data;
+       uint8_t *write_pointer;
+       struct sr_dev_inst *sdi;
+       struct sr_datafeed_packet packet;
+       struct sr_datafeed_logic logic;
+};
+
+static int alloc_submit_buffer(struct sr_dev_inst *sdi)
+{
+       struct dev_context *devc;
+       struct submit_buffer *buffer;
+       size_t size;
+
+       devc = sdi->priv;
+
+       buffer = g_malloc0(sizeof(*buffer));
+       devc->buffer = buffer;
+
+       buffer->unit_size = sizeof(uint16_t);
+       size = CHUNK_SIZE;
+       size /= buffer->unit_size;
+       buffer->max_samples = size;
+       size *= buffer->unit_size;
+       buffer->sample_data = g_try_malloc0(size);
+       if (!buffer->sample_data)
+               return SR_ERR_MALLOC;
+       buffer->write_pointer = buffer->sample_data;
+       sr_sw_limits_init(&devc->feed_limits);
+
+       buffer->sdi = sdi;
+       memset(&buffer->logic, 0, sizeof(buffer->logic));
+       buffer->logic.unitsize = buffer->unit_size;
+       buffer->logic.data = buffer->sample_data;
+       memset(&buffer->packet, 0, sizeof(buffer->packet));
+       buffer->packet.type = SR_DF_LOGIC;
+       buffer->packet.payload = &buffer->logic;
+
+       return SR_OK;
+}
+
+static int setup_submit_limit(struct dev_context *devc)
+{
+       struct sr_sw_limits *limits;
+       int ret;
+       GVariant *data;
+       uint64_t total;
+
+       limits = &devc->feed_limits;
+
+       ret = sr_sw_limits_config_get(&devc->cfg_limits,
+               SR_CONF_LIMIT_SAMPLES, &data);
+       if (ret != SR_OK)
+               return ret;
+       total = g_variant_get_uint64(data);
+       g_variant_unref(data);
+
+       sr_sw_limits_init(limits);
+       if (total) {
+               data = g_variant_new_uint64(total);
+               ret = sr_sw_limits_config_set(limits,
+                       SR_CONF_LIMIT_SAMPLES, data);
+               g_variant_unref(data);
+               if (ret != SR_OK)
+                       return ret;
+       }
+
+       sr_sw_limits_acquisition_start(limits);
+
+       return SR_OK;
+}
+
+static void free_submit_buffer(struct dev_context *devc)
+{
+       struct submit_buffer *buffer;
+
+       if (!devc)
+               return;
+
+       buffer = devc->buffer;
+       if (!buffer)
+               return;
+       devc->buffer = NULL;
+
+       g_free(buffer->sample_data);
+       g_free(buffer);
+}
+
+static int flush_submit_buffer(struct dev_context *devc)
+{
+       struct submit_buffer *buffer;
+       int ret;
+
+       buffer = devc->buffer;
+
+       /* Is queued sample data available? */
+       if (!buffer->curr_samples)
+               return SR_OK;
+
+       /* Submit to the session feed. */
+       buffer->logic.length = buffer->curr_samples * buffer->unit_size;
+       ret = sr_session_send(buffer->sdi, &buffer->packet);
+       if (ret != SR_OK)
+               return ret;
+
+       /* Rewind queue position. */
+       buffer->curr_samples = 0;
+       buffer->write_pointer = buffer->sample_data;
+
+       return SR_OK;
+}
+
+static int addto_submit_buffer(struct dev_context *devc,
+       uint16_t sample, size_t count)
+{
+       struct submit_buffer *buffer;
+       struct sr_sw_limits *limits;
+       int ret;
+
+       buffer = devc->buffer;
+       limits = &devc->feed_limits;
+       if (sr_sw_limits_check(limits))
+               count = 0;
+
+       /*
+        * Individually accumulate and check each sample, such that
+        * accumulation between flushes won't exceed local storage, and
+        * enforcement of user specified limits is exact.
+        */
+       while (count--) {
+               WL16(buffer->write_pointer, sample);
+               buffer->write_pointer += buffer->unit_size;
+               buffer->curr_samples++;
+               if (buffer->curr_samples == buffer->max_samples) {
+                       ret = flush_submit_buffer(devc);
+                       if (ret != SR_OK)
+                               return ret;
+               }
+               sr_sw_limits_update_samples_read(limits, 1);
+               if (sr_sw_limits_check(limits))
+                       break;
+       }
+
+       return SR_OK;
+}
+
 /*
  * In 100 and 200 MHz mode, only a single pin rising/falling can be
  * set as trigger. In other modes, two rising/falling triggers can be set,
@@ -582,7 +953,7 @@ SR_PRIV int sigma_convert_trigger(const struct sr_dev_inst *sdi)
                                /* Ignore disabled channels with a trigger. */
                                continue;
                        channelbit = 1 << (match->channel->index);
-                       if (devc->cur_samplerate >= SR_MHZ(100)) {
+                       if (devc->samplerate >= SR_MHZ(100)) {
                                /* Fast trigger support. */
                                if (trigger_set) {
                                        sr_err("Only a single pin trigger is "
@@ -605,16 +976,13 @@ SR_PRIV int sigma_convert_trigger(const struct sr_dev_inst *sdi)
                                if (match->match == SR_TRIGGER_ONE) {
                                        devc->trigger.simplevalue |= channelbit;
                                        devc->trigger.simplemask |= channelbit;
-                               }
-                               else if (match->match == SR_TRIGGER_ZERO) {
+                               } else if (match->match == SR_TRIGGER_ZERO) {
                                        devc->trigger.simplevalue &= ~channelbit;
                                        devc->trigger.simplemask |= channelbit;
-                               }
-                               else if (match->match == SR_TRIGGER_FALLING) {
+                               } else if (match->match == SR_TRIGGER_FALLING) {
                                        devc->trigger.fallingmask |= channelbit;
                                        trigger_set++;
-                               }
-                               else if (match->match == SR_TRIGGER_RISING) {
+                               } else if (match->match == SR_TRIGGER_RISING) {
                                        devc->trigger.risingmask |= channelbit;
                                        trigger_set++;
                                }
@@ -636,7 +1004,6 @@ SR_PRIV int sigma_convert_trigger(const struct sr_dev_inst *sdi)
        return SR_OK;
 }
 
-
 /* Software trigger to determine exact trigger position. */
 static int get_trigger_offset(uint8_t *samples, uint16_t last_sample,
                              struct sigma_trigger *t)
@@ -670,6 +1037,48 @@ static int get_trigger_offset(uint8_t *samples, uint16_t last_sample,
        return i & 0x7;
 }
 
+static gboolean sample_matches_trigger(struct dev_context *devc, uint16_t sample)
+{
+       /* TODO
+        * Check whether the combination of this very sample and the
+        * previous state match the configured trigger condition. This
+        * improves the resolution of the trigger marker's position.
+        * The hardware provided position is coarse, and may point to
+        * a position before the actual match.
+        *
+        * See the previous get_trigger_offset() implementation. This
+        * code needs to get re-used here.
+        */
+       (void)devc;
+       (void)sample;
+       (void)get_trigger_offset;
+
+       return FALSE;
+}
+
+static int check_and_submit_sample(struct dev_context *devc,
+       uint16_t sample, size_t count, gboolean check_trigger)
+{
+       gboolean triggered;
+       int ret;
+
+       triggered = check_trigger && sample_matches_trigger(devc, sample);
+       if (triggered) {
+               ret = flush_submit_buffer(devc);
+               if (ret != SR_OK)
+                       return ret;
+               ret = std_session_send_df_trigger(devc->buffer->sdi);
+               if (ret != SR_OK)
+                       return ret;
+       }
+
+       ret = addto_submit_buffer(devc, sample, count);
+       if (ret != SR_OK)
+               return ret;
+
+       return SR_OK;
+}
+
 /*
  * Return the timestamp of "DRAM cluster".
  */
@@ -678,101 +1087,121 @@ static uint16_t sigma_dram_cluster_ts(struct sigma_dram_cluster *cluster)
        return (cluster->timestamp_hi << 8) | cluster->timestamp_lo;
 }
 
-static void sigma_decode_dram_cluster(struct sigma_dram_cluster *dram_cluster,
-                                     unsigned int events_in_cluster,
-                                     unsigned int triggered,
-                                     struct sr_dev_inst *sdi)
+/*
+ * Return one 16bit data entity of a DRAM cluster at the specified index.
+ */
+static uint16_t sigma_dram_cluster_data(struct sigma_dram_cluster *cl, int idx)
 {
-       struct dev_context *devc = sdi->priv;
-       struct sigma_state *ss = &devc->state;
-       struct sr_datafeed_packet packet;
-       struct sr_datafeed_logic logic;
-       uint16_t tsdiff, ts;
-       uint8_t samples[2048];
-       unsigned int i;
+       uint16_t sample;
 
-       ts = sigma_dram_cluster_ts(dram_cluster);
-       tsdiff = ts - ss->lastts;
-       ss->lastts = ts;
+       sample = 0;
+       sample |= cl->samples[idx].sample_lo << 0;
+       sample |= cl->samples[idx].sample_hi << 8;
+       sample = (sample >> 8) | (sample << 8);
+       return sample;
+}
+
+/*
+ * Deinterlace sample data that was retrieved at 100MHz samplerate.
+ * One 16bit item contains two samples of 8bits each. The bits of
+ * multiple samples are interleaved.
+ */
+static uint16_t sigma_deinterlace_100mhz_data(uint16_t indata, int idx)
+{
+       uint16_t outdata;
+
+       indata >>= idx;
+       outdata = 0;
+       outdata |= (indata >> (0 * 2 - 0)) & (1 << 0);
+       outdata |= (indata >> (1 * 2 - 1)) & (1 << 1);
+       outdata |= (indata >> (2 * 2 - 2)) & (1 << 2);
+       outdata |= (indata >> (3 * 2 - 3)) & (1 << 3);
+       outdata |= (indata >> (4 * 2 - 4)) & (1 << 4);
+       outdata |= (indata >> (5 * 2 - 5)) & (1 << 5);
+       outdata |= (indata >> (6 * 2 - 6)) & (1 << 6);
+       outdata |= (indata >> (7 * 2 - 7)) & (1 << 7);
+       return outdata;
+}
+
+/*
+ * Deinterlace sample data that was retrieved at 200MHz samplerate.
+ * One 16bit item contains four samples of 4bits each. The bits of
+ * multiple samples are interleaved.
+ */
+static uint16_t sigma_deinterlace_200mhz_data(uint16_t indata, int idx)
+{
+       uint16_t outdata;
+
+       indata >>= idx;
+       outdata = 0;
+       outdata |= (indata >> (0 * 4 - 0)) & (1 << 0);
+       outdata |= (indata >> (1 * 4 - 1)) & (1 << 1);
+       outdata |= (indata >> (2 * 4 - 2)) & (1 << 2);
+       outdata |= (indata >> (3 * 4 - 3)) & (1 << 3);
+       return outdata;
+}
+
+static void sigma_decode_dram_cluster(struct dev_context *devc,
+       struct sigma_dram_cluster *dram_cluster,
+       size_t events_in_cluster, gboolean triggered)
+{
+       struct sigma_state *ss;
+       uint16_t tsdiff, ts, sample, item16;
+       unsigned int i;
 
-       packet.type = SR_DF_LOGIC;
-       packet.payload = &logic;
-       logic.unitsize = 2;
-       logic.data = samples;
+       if (!devc->use_triggers || !ASIX_SIGMA_WITH_TRIGGER)
+               triggered = FALSE;
 
        /*
-        * First of all, send Sigrok a copy of the last sample from
-        * previous cluster as many times as needed to make up for
-        * the differential characteristics of data we get from the
-        * Sigma. Sigrok needs one sample of data per period.
+        * If this cluster is not adjacent to the previously received
+        * cluster, then send the appropriate number of samples with the
+        * previous values to the sigrok session. This "decodes RLE".
         *
-        * One DRAM cluster contains a timestamp and seven samples,
-        * the units of timestamp are "devc->period_ps" , the first
-        * sample in the cluster happens at the time of the timestamp
-        * and the remaining samples happen at timestamp +1...+6 .
+        * These samples cannot match the trigger since they just repeat
+        * the previously submitted data pattern. (This assumption holds
+        * for simple level and edge triggers. It would not for timed or
+        * counted conditions, which currently are not supported.)
         */
-       for (ts = 0; ts < tsdiff - (EVENTS_PER_CLUSTER - 1); ts++) {
-               i = ts % 1024;
-               samples[2 * i + 0] = ss->lastsample & 0xff;
-               samples[2 * i + 1] = ss->lastsample >> 8;
-
-               /*
-                * If we have 1024 samples ready or we're at the
-                * end of submitting the padding samples, submit
-                * the packet to Sigrok.
-                */
-               if ((i == 1023) || (ts == (tsdiff - EVENTS_PER_CLUSTER))) {
-                       logic.length = (i + 1) * logic.unitsize;
-                       sr_session_send(sdi, &packet);
-               }
+       ss = &devc->state;
+       ts = sigma_dram_cluster_ts(dram_cluster);
+       tsdiff = ts - ss->lastts;
+       if (tsdiff > 0) {
+               size_t count;
+               count = tsdiff * devc->samples_per_event;
+               (void)check_and_submit_sample(devc, ss->lastsample, count, FALSE);
        }
+       ss->lastts = ts + EVENTS_PER_CLUSTER;
 
        /*
-        * Parse the samples in current cluster and prepare them
-        * to be submitted to Sigrok.
+        * Grab sample data from the current cluster and prepare their
+        * submission to the session feed. Handle samplerate dependent
+        * memory layout of sample data. Accumulation of data chunks
+        * before submission is transparent to this code path, specific
+        * buffer depth is neither assumed nor required here.
         */
+       sample = 0;
        for (i = 0; i < events_in_cluster; i++) {
-               samples[2 * i + 1] = dram_cluster->samples[i].sample_lo;
-               samples[2 * i + 0] = dram_cluster->samples[i].sample_hi;
-       }
-
-       /* Send data up to trigger point (if triggered). */
-       int trigger_offset = 0;
-       if (triggered) {
-               /*
-                * Trigger is not always accurate to sample because of
-                * pipeline delay. However, it always triggers before
-                * the actual event. We therefore look at the next
-                * samples to pinpoint the exact position of the trigger.
-                */
-               trigger_offset = get_trigger_offset(samples,
-                                       ss->lastsample, &devc->trigger);
-
-               if (trigger_offset > 0) {
-                       packet.type = SR_DF_LOGIC;
-                       logic.length = trigger_offset * logic.unitsize;
-                       sr_session_send(sdi, &packet);
-                       events_in_cluster -= trigger_offset;
-               }
-
-               /* Only send trigger if explicitly enabled. */
-               if (devc->use_triggers) {
-                       packet.type = SR_DF_TRIGGER;
-                       sr_session_send(sdi, &packet);
+               item16 = sigma_dram_cluster_data(dram_cluster, i);
+               if (devc->samplerate == SR_MHZ(200)) {
+                       sample = sigma_deinterlace_200mhz_data(item16, 0);
+                       check_and_submit_sample(devc, sample, 1, triggered);
+                       sample = sigma_deinterlace_200mhz_data(item16, 1);
+                       check_and_submit_sample(devc, sample, 1, triggered);
+                       sample = sigma_deinterlace_200mhz_data(item16, 2);
+                       check_and_submit_sample(devc, sample, 1, triggered);
+                       sample = sigma_deinterlace_200mhz_data(item16, 3);
+                       check_and_submit_sample(devc, sample, 1, triggered);
+               } else if (devc->samplerate == SR_MHZ(100)) {
+                       sample = sigma_deinterlace_100mhz_data(item16, 0);
+                       check_and_submit_sample(devc, sample, 1, triggered);
+                       sample = sigma_deinterlace_100mhz_data(item16, 1);
+                       check_and_submit_sample(devc, sample, 1, triggered);
+               } else {
+                       sample = item16;
+                       check_and_submit_sample(devc, sample, 1, triggered);
                }
        }
-
-       if (events_in_cluster > 0) {
-               packet.type = SR_DF_LOGIC;
-               logic.length = events_in_cluster * logic.unitsize;
-               logic.data = samples + (trigger_offset * logic.unitsize);
-               sr_session_send(sdi, &packet);
-       }
-
-       ss->lastsample =
-               samples[2 * (events_in_cluster - 1) + 0] |
-               (samples[2 * (events_in_cluster - 1) + 1] << 8);
-
+       ss->lastsample = sample;
 }
 
 /*
@@ -784,22 +1213,24 @@ static void sigma_decode_dram_cluster(struct sigma_dram_cluster *dram_cluster,
  * For 50 MHz and below, events contain one sample for each channel,
  * spread 20 ns apart.
  */
-static int decode_chunk_ts(struct sigma_dram_line *dram_line,
-                          uint16_t events_in_line,
-                          uint32_t trigger_event,
-                          struct sr_dev_inst *sdi)
+static int decode_chunk_ts(struct dev_context *devc,
+       struct sigma_dram_line *dram_line,
+       size_t events_in_line, size_t trigger_event)
 {
        struct sigma_dram_cluster *dram_cluster;
-       struct dev_context *devc = sdi->priv;
-       unsigned int clusters_in_line =
-               (events_in_line + (EVENTS_PER_CLUSTER - 1)) / EVENTS_PER_CLUSTER;
+       unsigned int clusters_in_line;
        unsigned int events_in_cluster;
        unsigned int i;
-       uint32_t trigger_cluster = ~0, triggered = 0;
+       uint32_t trigger_cluster;
+
+       clusters_in_line = events_in_line;
+       clusters_in_line += EVENTS_PER_CLUSTER - 1;
+       clusters_in_line /= EVENTS_PER_CLUSTER;
+       trigger_cluster = ~0;
 
        /* Check if trigger is in this chunk. */
-       if (trigger_event < (64 * 7)) {
-               if (devc->cur_samplerate <= SR_MHZ(50)) {
+       if (trigger_event < EVENTS_PER_ROW) {
+               if (devc->samplerate <= SR_MHZ(50)) {
                        trigger_event -= MIN(EVENTS_PER_CLUSTER - 1,
                                             trigger_event);
                }
@@ -820,9 +1251,8 @@ static int decode_chunk_ts(struct sigma_dram_line *dram_line,
                        events_in_cluster = EVENTS_PER_CLUSTER;
                }
 
-               triggered = (i == trigger_cluster);
-               sigma_decode_dram_cluster(dram_cluster, events_in_cluster,
-                                         triggered, sdi);
+               sigma_decode_dram_cluster(devc, dram_cluster,
+                       events_in_cluster, i == trigger_cluster);
        }
 
        return SR_OK;
@@ -830,54 +1260,91 @@ static int decode_chunk_ts(struct sigma_dram_line *dram_line,
 
 static int download_capture(struct sr_dev_inst *sdi)
 {
-       struct dev_context *devc = sdi->priv;
        const uint32_t chunks_per_read = 32;
+
+       struct dev_context *devc;
        struct sigma_dram_line *dram_line;
        int bufsz;
        uint32_t stoppos, triggerpos;
        uint8_t modestatus;
-
        uint32_t i;
        uint32_t dl_lines_total, dl_lines_curr, dl_lines_done;
-       uint32_t dl_events_in_line = 64 * 7;
-       uint32_t trg_line = ~0, trg_event = ~0;
+       uint32_t dl_first_line, dl_line;
+       uint32_t dl_events_in_line;
+       uint32_t trg_line, trg_event;
+       int ret;
 
-       dram_line = g_try_malloc0(chunks_per_read * sizeof(*dram_line));
-       if (!dram_line)
-               return FALSE;
+       devc = sdi->priv;
+       dl_events_in_line = EVENTS_PER_ROW;
 
        sr_info("Downloading sample data.");
+       devc->state.state = SIGMA_DOWNLOAD;
 
-       /* Stop acquisition. */
-       sigma_set_register(WRITE_MODE, 0x11, devc);
+       /*
+        * Ask the hardware to stop data acquisition. Reception of the
+        * FORCESTOP request makes the hardware "disable RLE" (store
+        * clusters to DRAM regardless of whether pin state changes) and
+        * raise the POSTTRIGGERED flag.
+        */
+       sigma_set_register(WRITE_MODE, WMR_FORCESTOP | WMR_SDRAMWRITEEN, devc);
+       do {
+               if (sigma_read_register(READ_MODE, &modestatus, 1, devc) != 1) {
+                       sr_err("failed while waiting for RMR_POSTTRIGGERED bit");
+                       return FALSE;
+               }
+       } while (!(modestatus & RMR_POSTTRIGGERED));
 
        /* Set SDRAM Read Enable. */
-       sigma_set_register(WRITE_MODE, 0x02, devc);
+       sigma_set_register(WRITE_MODE, WMR_SDRAMREADEN, devc);
 
        /* Get the current position. */
        sigma_read_pos(&stoppos, &triggerpos, devc);
 
        /* Check if trigger has fired. */
-       modestatus = sigma_get_register(READ_MODE, devc);
-       if (modestatus & 0x20) {
+       if (sigma_read_register(READ_MODE, &modestatus, 1, devc) != 1) {
+               sr_err("failed to read READ_MODE register");
+               return FALSE;
+       }
+       trg_line = ~0;
+       trg_event = ~0;
+       if (modestatus & RMR_TRIGGERED) {
                trg_line = triggerpos >> 9;
                trg_event = triggerpos & 0x1ff;
        }
 
        /*
-        * Determine how many 1024b "DRAM lines" do we need to read from the
-        * Sigma so we have a complete set of samples. Note that the last
-        * line can be only partial, containing less than 64 clusters.
+        * Determine how many "DRAM lines" of 1024 bytes each we need to
+        * retrieve from the Sigma hardware, so that we have a complete
+        * set of samples. Note that the last line need not contain 64
+        * clusters, it might be partially filled only.
+        *
+        * When RMR_ROUND is set, the circular buffer in DRAM has wrapped
+        * around. Since the status of the very next line is uncertain in
+        * that case, we skip it and start reading from the next line.
         */
-       dl_lines_total = (stoppos >> 9) + 1;
-
+       dl_first_line = 0;
+       dl_lines_total = (stoppos >> ROW_SHIFT) + 1;
+       if (modestatus & RMR_ROUND) {
+               dl_first_line = dl_lines_total + 1;
+               dl_lines_total = ROW_COUNT - 2;
+       }
+       dram_line = g_try_malloc0(chunks_per_read * sizeof(*dram_line));
+       if (!dram_line)
+               return FALSE;
+       ret = alloc_submit_buffer(sdi);
+       if (ret != SR_OK)
+               return FALSE;
+       ret = setup_submit_limit(devc);
+       if (ret != SR_OK)
+               return FALSE;
        dl_lines_done = 0;
-
        while (dl_lines_total > dl_lines_done) {
                /* We can download only up-to 32 DRAM lines in one go! */
-               dl_lines_curr = MIN(chunks_per_read, dl_lines_total);
+               dl_lines_curr = MIN(chunks_per_read, dl_lines_total - dl_lines_done);
 
-               bufsz = sigma_read_dram(dl_lines_done, dl_lines_curr,
+               dl_line = dl_first_line + dl_lines_done;
+               dl_line %= ROW_COUNT;
+               bufsz = sigma_read_dram(dl_line, dl_lines_curr,
                                        (uint8_t *)dram_line, devc);
                /* TODO: Check bufsz. For now, just avoid compiler warnings. */
                (void)bufsz;
@@ -899,49 +1366,35 @@ static int download_capture(struct sr_dev_inst *sdi)
                        if (dl_lines_done + i == trg_line)
                                trigger_event = trg_event;
 
-                       decode_chunk_ts(dram_line + i, dl_events_in_line,
-                                       trigger_event, sdi);
+                       decode_chunk_ts(devc, dram_line + i,
+                               dl_events_in_line, trigger_event);
                }
 
                dl_lines_done += dl_lines_curr;
        }
+       flush_submit_buffer(devc);
+       free_submit_buffer(devc);
+       g_free(dram_line);
 
        std_session_send_df_end(sdi);
 
-       sdi->driver->dev_acquisition_stop(sdi);
-
-       g_free(dram_line);
+       devc->state.state = SIGMA_IDLE;
+       sr_dev_acquisition_stop(sdi);
 
        return TRUE;
 }
 
 /*
- * Handle the Sigma when in CAPTURE mode. This function checks:
- * - Sampling time ended
- * - DRAM capacity overflow
- * This function triggers download of the samples from Sigma
- * in case either of the above conditions is true.
+ * Periodically check the Sigma status when in CAPTURE mode. This routine
+ * checks whether the configured sample count or sample time have passed,
+ * and will stop acquisition and download the acquired samples.
  */
 static int sigma_capture_mode(struct sr_dev_inst *sdi)
 {
-       struct dev_context *devc = sdi->priv;
-
-       uint64_t running_msec;
-       struct timeval tv;
-
-       uint32_t stoppos, triggerpos;
-
-       /* Check if the selected sampling duration passed. */
-       gettimeofday(&tv, 0);
-       running_msec = (tv.tv_sec - devc->start_tv.tv_sec) * 1000 +
-                      (tv.tv_usec - devc->start_tv.tv_usec) / 1000;
-       if (running_msec >= devc->limit_msec)
-               return download_capture(sdi);
+       struct dev_context *devc;
 
-       /* Get the position in DRAM to which the FPGA is writing now. */
-       sigma_read_pos(&stoppos, &triggerpos, devc);
-       /* Test if DRAM is full and if so, download the data. */
-       if ((stoppos >> 9) == 32767)
+       devc = sdi->priv;
+       if (sr_sw_limits_check(&devc->acq_limits))
                return download_capture(sdi);
 
        return TRUE;
@@ -961,6 +1414,14 @@ SR_PRIV int sigma_receive_data(int fd, int revents, void *cb_data)
        if (devc->state.state == SIGMA_IDLE)
                return TRUE;
 
+       /*
+        * When the application has requested to stop the acquisition,
+        * then immediately start downloading sample data. Otherwise
+        * keep checking configured limits which will terminate the
+        * acquisition and initiate download.
+        */
+       if (devc->state.state == SIGMA_STOPPING)
+               return download_capture(sdi);
        if (devc->state.state == SIGMA_CAPTURE)
                return sigma_capture_mode(sdi);